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文艺 复兴 以 来 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规范 ， 使 西方 国家 在 自然 科学 的 各 
个 领域 取得 了 垄断 性 的 优势 ， 也 正 是 这 样 的 优势 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 家 非 
出 、 独 领 风骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧 密 地 结合 ， 计 算 机 学 科 中 
的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科 学 著作 ， 不 仅 壁 划 了 研究 
的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 因 年 月 的 流 
逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ,我 国 的 计算 机 产业 发 展 迅 猛 ， 对 专业 人 才 的 需求 日 益 
迫切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 战略 上 显 
得 举足轻重 。 在 我 国信 息 技 术 发 展 时 间 较 短 的 现状 下 ， 美 国 等 发 达 国家 在 其 计算 机 科学 发 展 的 
几 十 年 间 积 淀 和 发 展 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国外 优秀 计算 机 教材 
将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 设 真正 的 世界 一 流 
大 学 的 必由之路 。 

机 械 工业 出 版 社 华章 公司 较 早 意识 到 “出 版 要 为 教育 服务 ”"。 自 1998 年 开始 ， 我 们 就 将 工作 
重点 放 在 了 遂 选 、 移 译 国 外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson、McGraw- Hill、 
Elsevier、MIT 、John Wiley & Sons 、Cengage 等 世界 著名 出 版 公司 建立 了 良好 的 合作 关系 ， 从 它们 
现 有 的 数 百 种 教材 中 甄选 出 Andrew S. Tanenbaum 、Bjarne Stroustrup 、Brian W. Kernighan、Dennis 
Ritchie 、Jim Gray 、Afred V. Aho 、John E. Hopcroft 、jJeffrey D. Ullman 、Abraham Silberschatz 、Wil- 
liam Stallings 、Donald E. Knuth 、John L. Hennessy 、Larry L. Peterson 等 大 师 名 家 的 一 批 经 典 作品 ， 
以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 究 及 珍藏 。 大 理 石 纹理 的 封面 ， 也 正体 
现 了 这 套 丛书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 易 力 相助 ， 国 内 的 专家 不 仅 提供 了 中 
肯 的 选 题 指导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 在 中 
国 的 传播 ， 有 的 还 专门 为 其 书 的 中 译本 作 序 。 迄 今 , “计算机 科学 丛书 ”已 经 出 版 了 近 500 个 
品种 ， 这 些 书 籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书籍 。 其 影 
印 版 “经 典 原版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因 素 使 我 们 的 图 
书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完善 和 教材 改革 的 逐渐 深化 ， 
教育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 人 一 个 新 的 阶段 ， 我 们 的 目标 是 尽善尽美 ， 而 反 
馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公 司 欢迎 老师 和 读者 对 我 们 的 工作 提出 
建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


华章 网 站 ， www. hzbook. com 
电子 邮件 : hzjsj@ hzbook. com 
联系 电话 : (010)88379604 HZ Book 
联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 号 ai 

邮政 编码 ， 100037 华章 科技 图 书 出 版 中 心 
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本 书 第 2 版 、 第 3 版 和 第 4 版 分 别 于 2007 年 、2013 年 和 2015 年 获得 美国 教材 和 学 术 著作 
者 协会 颁发 的 “优秀 教材 奖 ”"， 被 许多 大 学 选 为 教材 和 主要 参考 书 。 在 翻译 过 程 中 ， 书 中 的 几 
个 主要 特点 让 我 们 印象 深刻 。 首 先 ， 书 中 提供 了 很 多 现实 世界 的 例子 ， 这 能 帮助 学 生理 解 基 本 
概念 如 何 应 用 于 计算 领域 ， 使 理论 与 应 用 达到 很 好 的 平衡 ; 其 次 ， 书 的 内 容 符合 ACM/IEEE 
CS2013 建议 的 主题 ， 并 增加 了 有 助 于 学 生 继续 学 习 的 一 些 主题 ; 最 后 ， 书 中 的 讲解 、 例 子 、 
练习 和 MARIE 仿真 器 等 为 学 生 提供 了 很 好 的 学 习 体验 。 

本 书包 括 13 章 和 一 个 附录 。 第 1 章 是 一 般 性 的 历史 概述 。 第 2 章 介 绍 数字 和 字符 信息 的 
表示 方法 。 第 3 章 介绍 数字 逻辑 的 经 典 表示 及 其 与 布尔 代数 的 关系 。 第 4 章 介绍 计算 机 组 成 和 
体系 结构 的 基本 概念 。 第 5 章 深入 讲解 指令 集 架构 。 第 6 章 是 基本 存储 器 系统 的 概念 。 第 7 前 
介绍 0 原理 、 总 线 和 外 部 存储 设备 。 第 8 章 介绍 编译 器 、 程 序 与 体系 结构 的 关系 。 第 9 草 概 
述 近 年 来 出 现 的 其 他 体系 结构 。 第 10 章 介绍 嵌入 式 系统 。 第 11 章 介绍 各 种 性 能 分 析 和 管理 问 
题 。 第 12 章 介绍 网 络 的 组 成 和 体系 结构 。 第 13 章 介 绍 0 架构 。 附 录 介 绍 数据 结构 的 基本 

念 。 

本 书 第 1 章 、 第 12 章 、 第 13 章 、 前 言 、 附 录 A、 精 选 习题 答案 与 提示 由 天 津 大 学 计算 机 
科学 与 技术 学 院 张 钢 翻 译 ， 第 2 章 和 第 3 章 由 天 津 大 学 仁爱 学 院 何 颖 翻译 ， 第 4 章 和 第 7 章 由 
天 津 大 学 仁爱 学 院 李 春 阁 翻译 ， 第 5 章 、 第 6 章 和 第 11 章 由 天 津 大 学 计算 机 科学 与 技术 学 院 
李 雪 威 翻译 ,第 8 ~ 10 章 由 天 津 大 学 计算 机 科学 与 技术 学 院 魏 继 增 翻 译 。 天 津 大 学 仁爱 学 院 杨 
志 奇 审阅 修改 了 第 3 章 ， 天 津 大 学 计算 机 科学 与 技术 学 院 魏 继 增 审阅 修改 了 第 2 ~4 章 和 第 7 
章 。 天 津 大 学 计算 机 科学 与 技术 学 院 张 钢 审阅 修改 了 全 书 。 

尽管 我 们 从 事 计算 机 组 成 原理 和 计算 机 体系 结构 教学 和 科研 工作 多 年 ， 而 且 在 翻译 过 程 中 
始终 本 着 认真 负责 的 态度 ， 对 一 些 章节 的 翻译 也 颇 费 心思 ， 在 尊重 原著 的 前 提 下 ， 谨慎 修改 了 
原著 出 现 的 一 些 错 误 ， 力 求 翻译 准确 ， 但 是 翻译 中 的 错误 之 处 在 所 难免 ， 敬 请 广大 读者 不 音 网 
教 和 批评 指正 。 
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致 学 生 

这 是 一 本 关于 计算 机 组 成 与 体系 结构 的 书 。 它 重点 研究 处 理 数字 信息 所 需要 的 各 种 组 件 的 
功能 和 设计 。 我 们 把 计算 系统 分 成 一 系列 的 层次 ， 从 低层 的 硬件 到 更 高 层 的 软件 ， 包 括 汇 编程 
序 和 操作 系统 。 这 些 层 构成 了 虚拟 机 的 层次 结构 。 关 于 计算 机 组 成 的 研究 主要 集中 在 这 种 层次 
结构 上 ， 包 括 如 何 划 分 所 涉及 的 层次 和 如 何 实现 每 个 层次 。 关 于 计算 机 体系 结构 的 研究 主要 集 
中 在 硬件 和 软件 之 间 的 接口 上 ， 强 调 系统 的 结构 和 行为 。 本 书 中 包含 的 主要 信息 涉及 计算 机 硬 
件 、 计 算 机 组 成 和 体系 结构 以 及 它们 与 软件 性 能 的 关系 。 

学 生 总 是 问 ,“ 如 果 我 是 一 名 计算 机 科学 专业 的 学 生 ， 我 必须 学 习 计算 机 硬件 吗 ? 那 不 是 
计算 机 工程 师 要 学 的 吗 ? 为 什么 我 要 关心 计算 机 内 部 是 什么 样子 呢 ?” 作 为 计算 机 的 使 用 者 ， 
我 们 可 能 不 必 关 心计 算 机 内 部 是 什么 样子 的 ， 就 像 开车 时 我 们 不 需要 知道 汽车 发 动机 下 面 是 什 
么 样子 一 样 。 在 不 理解 高 级 语言 程序 如 何 执行 的 情况 下 ， 我 们 当然 能 写 高 级 语言 程序 ; 在 不 理 
解 各 种 应 用 程序 包 实际 如 何 工 作 的 情况 下 ， 我 们 也 可 以 使 用 各 种 应 用 程序 包 。 但 是 ， 当 需要 使 
写 出 来 的 程序 变 得 更 快 和 更 有 效 ， 或 者 正在 使 用 的 应 用 程序 没有 达到 要 求 时， 我 们 该 怎么 办 ? 
作为 计算 机 科学 家 ， 为 了 解决 这 些 问 题 我 们 需要 对 计算 机 系统 本 身 有 基本 的 理解 。 

在 计算 机 系统 中 ， 计 算 机 硬件 与 程序 和 软件 组 件 的 许多 方面 之 间 有 一 种 基本 的 关系 。 为 了 
写 出 好 软件 ， 理 解 整个 计算 机 系统 是 非常 重要 的 。 理 解 硬件 能 够 帮助 你 解释 有 时 潜入 程序 中 的 
神秘 错误 ， 如 分 段 错误 和 总 线 错误 。 高 级 程序 员 必 须 具备 的 计算 机 组 成 和 计算 机 体系 结构 的 知 
识 水 平 ， 取决 于 所 要 完成 的 任务 。 

例如 ， 在 写 编译 右 程 序 时 ， 你 必须 理解 运行 所 编译 的 程序 的 特定 硬件 。 一 些 在 硬件 中 使 用 
的 思想 ( 如 流水 线 ) 可 能 适合 于 编译 技术 ， 从 而 使 编译 器 更 快 和 更 高 效 。 对 大 型 复杂 的 实时 系 
统 建 模 时 ， 你 必须 理解 浮 点 运算 是 如 何 实现 和 如 何 工作 的 (它们 不 一 定 是 同一 回 事 ) 。 在 为 视 
频 设 备 、 磁 盘 或 其 他 [0O 设备 写 驱动 程序 时 ， 一 般 来 说 ， 你 需要 很 好 地 理解 VO 接口 和 计算 机 
体系 结构 。 如 果 你 想 做 嵌入 式 系统 方面 的 工作 ， 由 于 嵌入 式 系统 通常 是 非常 受 资源 约束 的 ， 你 
必须 理解 所 有 的 时 间 、 空 间 和 价格 的 权衡 。 在 进行 硬件 、 网 络 或 特殊 算法 方面 的 研究 和 提出 硬 
件 、 网 络 或 特殊 算法 方面 的 建议 时 ， 你 必须 理解 基准 测试 并 且 学 习 如 何 表示 性 能 结果 。 在 买 硬 
件 之 前 ， 你 需要 理解 基准 测试 和 其 他 可 以 巧妙 处 理性 能 结果 以 “证 明 ” 一 个 系统 比 另 一 个 系 
统 更 好 的 所 有 方法 。 不 管 我 们 擅长 的 专业 领域 是 什么 ， 作 为 计算 机 科学 家 ， 理 解 硬件 如 何 与 软 
件 交 互 是 非常 重要 的 。 

你 可 能 会 奇怪 ， 为 什么 英文 书 名 中 写 着 essentials 的 书 会 这 么 厚 。 原 因 有 两 个 方面 。 首 先 ， 
计算 机 组 成 的 主题 是 宽泛 和 日 益 发 展 的 。 其 次 ， 在 这 个 迅速 发 展 的 信息 海洋 中 哪些 主题 是 真正 
的 基础 ， 哪 些 主 题 只 是 有 助 于 了 解 这 个 领域 ， 几 乎 没有 共识 。 这 本 书 的 一 个 目的 是 符合 由 
ACM 和 IEEE 联合 发 布 的 关于 计算 机 体系 结构 课程 指南 的 要 求 。 这 个 指南 包含 了 专家 认可 的 关 
于 计算 机 组 成 和 体系 结构 主题 的 基础 核心 知识 。 

我 们 已 经 扩大 了 ACM/AIEEE 建议 的 主题 ， 增 加 了 我 们 认为 对 继续 研究 计算 机 科学 和 提高 专 
业 水 平 有 用 的 (未 必 是 基础 的 ) 主题 。 我 们 认为 这 些 主题 将 有 助 于 你 继续 在 操作 系统 、 编 译 程 
序 、 数 据 库 管 理 和 数据 通信 等 计算 机 科学 领域 的 学 习 。 本 书 中 包含 的 其 他 主题 将 有 助 于 理解 实 
际 系统 在 现实 生活 中 是 如 何 工 作 的 。 
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我 们 希望 你 阅读 本 书 是 一 次 愉快 的 经 历 ， 并 且 花 时 间 深 入 钻研 我 们 提供 的 一 些 材料 。 我 们 
的 目的 是 在 你 正式 完成 课程 后 ， 这 本 书 仍 将 是 有 用 的 参考 书 。 虽 然 我 们 给 了 你 大 量 的 信息 ， 但 
这 仅 是 你 学 习 和 职业 生涯 的 基础 。 成 功 的 计算 机 专业 人 员 会 不 断 深 入 了 解 计 算 机 工作 原理 。 


致 教师 

本 书 是 在 宾夕法尼亚 州立 大 学 哈里 斯 堡 校区 教 两 个 班 的 计算 机 组 成 和 体系 结构 课程 的 基础 
上 形成 的 。 随 着 计算 机 科学 课程 的 发 展 ， 我 们 发 现 不 仅 需 要 修改 课程 中 所 教 的 材料 ， 而 且 需 要 
把 课程 从 连续 开设 两 个 学 期 压缩 为 一 个 学 期 (三 学 分 )。 许 多 其 他 学 校 也 已 经 认识 到 需要 压缩 
教材 ， 以 便 为 新 出 现 的 主题 腾 出 空间 。 这 门 新 课程 以 及 这 本 教材 主要 是 针对 计算 机 科学 专业 
的 ， 旨 在 讨论 计算 机 科学 专业 学 生 必须 熟悉 的 计算 机 组 成 和 体系 结构 中 的 主题 。 本 书 整合 了 这 
些 领域 的 基本 原理 ， 为 计算 机 科学 专业 的 学 生 提供 了 必要 的 广度 ， 同 时 为 在 计算 机 科学 领域 继 
续 学 习 的 学 生 提供 了 必要 的 深度 。 

在 写本 书 时 ， 我 们 的 主要 目标 是 改变 讲授 计算 机 组 成 和 体系 结构 课程 的 典型 方式 。 计 算 机 
科学 专业 的 学 生 在 学 完 计 算 机 组 成 和 体系 结构 课程 之 后 ， 不 仅 要 了 解构 建 数字 计算 机 的 重要 基 
本 概念 ， 而 且 还 要 理解 这 些 概念 如 何 应 用 于 现实 世界 。 这 些 概念 应 该 超越 特定 厂家 的 术语 和 设 
计 。 事 实 上 ， 学 生 应 该 能 够 理解 给 定 的 特定 概念 并 且 能 将 其 翻译 成 一 般 概 念 ， 反 之 亦 然 。 此 
外 ， 学 生 必 须 为 进一步 的 专业 学 习 打下 坚实 的 基础 。 

本 书 介 绍 的 主题 是 每 个 计算 机 科学 专业 的 学 生 都 应 该 接触 、 熟 悉 或 精通 的 。 我 们 并 没有 期 望 
学 生 能 完全 掌握 所 有 主题 。 然 而 ， 我 们 坚信 有 些 主 题 必须 要 掌握 ， 有 些 主 题 必须 有 一 定 程度 的 了 
解 ， 有 些 主 题 接触 一 下 就 足够 了 。 

我 们 不 认为 孤立 地 研究 一 般 性 的 原理 就 可 以 把 这 些 主题 学 到 足够 深入 。 因 此 ， 我 们 提出 的 
主题 是 一 套 完整 的 解决 方案 ， 而 不 是 一 个 个 信息 的 简单 集合 。 我 们 认为 书 中 的 解释 、 例 子 、 练 
习 、 教 程 和 仿真 器 全 部 结合 起 来 ， 为 学 生 提 供 了 整体 的 学 习 体 验 ， 这 种 学 习 体 验 在 一 定 程度 上 
揭示 了 现代 数字 计算 机 的 内 部 工作 方式 。 

我 们 以 一 种 非 正式 的 风格 写 了 这 本 书 ， 省 略 了 不 必要 的 术语 ， 语 言 简洁 ， 并 且 避 免 了 不 必 
要 的 抽象 ， 希 望 能 提高 学 生 的 学 习 热 情 。 我 们 也 扩大 了 在 主流 体系 结构 书 中 能 够 找到 的 经 典 主 
题 的 范围 ， 包 括 系统 软件 、 操 作 系统 的 简要 介绍 、 性 能 问题 、 其 他 体系 结构 和 对 网 络 的 简明 介 
绍 ， 因 为 这 些 主题 与 计算 机 硬件 密切 相关 。 像 大 多 数 书 一 样 ， 我 们 选择 了 一 种 体系 结构 模型 ， 
但 它 是 一 个 我 们 在 头脑 中 简单 设计 的 模型 。 

与 CS2013 的 关系 

2013 年 10 月 ，ACM/IEEE 联合 工作 组 公布 了 计算 机 科学 课程 计划 2013( CS2013 ) 。 虽 然 我 
们 主要 关注 计算 机 体系 结构 知识 域 ,但 是 新 指南 建议 通过 这 门 课程 整合 核心 知识 。 因 此 ， 我 们 
也 要 关注 本 书 所 讲 的 体系 结构 之 外 的 更 多 知识 域 。 

CS2013 是 对 CS2008 的 全 面 修订 ， 主 要 聚焦 于 计算 机 科学 课程 计划 中 的 基础 概念 ， 同 时 为 
了 满足 个 别 机 构 的 需求 而 仍然 保留 了 足够 的 灵活 性 。 指 南 中 采用 了 核心 一 级 和 核心 二 级 主题 的 
概念 ， 并 加 入 了 选修 主题 。 核 心 一 级 主题 是 每 个 计算 机 科学 课程 计划 中 都 应 该 包含 的 主题 。 核 
心 二 级 主题 是 计算 机 科学 课程 计划 中 应 该 包含 90% ~ 100% 的 主题 。 选 修 主 题 是 课程 计划 向 广 
度 和 深度 扩展 的 主题 。 指 南 中 以 课时 方式 列 出 了 对 每 个 主题 建议 的 范围 。 

从 CS2008 到 CS2013 ， 在 体系 结构 和 组 成 (AR) 知识 域 方面 的 主要 变化 是 课时 数 从 36 降 到 
16， 然 而 引入 了 一 个 新 的 系统 基础 (SF) 知识 域 ， 它 包括 以 前 在 AR 模块 中 给 出 的 一 些 概念 ( 包 
括 硬件 组 成 和 体系 结构 ) 。 若 想 了 解 每 个 知识 域 所 包括 内 容 的 更 多 信息 ， 读 者 可 以 参考 CS2013 


指南 (http :www. acm. org/education/ curricula-recommendations ) 。 
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本 书 ( 原 书 第 4 版 ) 除 了 整合 来 自 其 他 知识 单元 的 材料 外 ， 与 ACMAIEEE CS2013 指南 中 关 
于 计算 机 组 成 和 体系 结构 的 部 分 是 直接 相关 的 。 表 P-1 列 出 了 本 教材 与 AR 知识 域 中 的 8 个 主 
题 的 对 应 关系 。 对 于 其 他 知识 域 ， 仅 列 出 本 教材 所 覆盖 的 主题 。 


表 P-1 本 书 覆 盖 的 A ACM/IEEE CS2013 主题 
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编写 本 书 的 目的 

市 场 上 已 经 有 很 多 关于 计算 机 组 成 和 体系 结构 方面 的 教材 。 在 讲授 这 门 课 程 超过 35 年 的 
时 间 里 ， 我 们 已 经 使 用 过 许多 非常 好 的 教材 。 然 而 ， 在 每 次 讲授 这 门 课程 时 ， 内 容 都 变化 了 ， 
最 终 我 们 发 现 要 写 大 量 的 课程 讲义 来 补充 课堂 上 必须 讲授 的 素材 。 课 程 素 材 正 在 从 用 计算 机 工 
程 方法 讨论 组 成 和 体系 结构 ， 变 成 用 计算 机 科学 方法 对 这 些 主题 进行 讨论 。 当 决定 把 计算 机 组 
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成 课程 和 计算 机 体系 结构 课程 合并 为 一 门 课程 时 ， 我 们 根本 找 不 到 覆盖 专业 所 必需 的 、 从 计算 
机 科学 角度 编写 的 、 不 使 用 特定 机 器 术语 的 并 且 在 讲授 这 些 主题 之 前 可 以 激发 学 生 积极 性 的 
教材 。 

在 本 教材 中 ， 我 们 希望 传达 现代 计算 系统 开发 中 使 用 的 设计 思想 ， 以 及 这 种 设计 思想 对 计 
算 机 科学 专业 学 生 的 影响 。 然 而 ， 学 生 在 理解 和 领会 有 关 设 计 的 方方面面 之 前 ， 必 须 掌握 基本 
概念 。 大 多 数 计算 机 组 成 和 体系 结构 的 教材 都 有 相似 的 技术 信息 。 然 而 ,我 们 对 这 些 信息 的 覆 
盖 水 平 以 及 与 计算 机 科学 专业 学 生 相关 的 背景 给 予 了 特别 的 关注 。 例 如 ,在 本 书 中 ， 当 介绍 其 
体例 子 时 ， 我 们 会 给 出 与 个 人 计算 机 、 企 业 系统 和 大 型 机 相关 的 例子 ， 因 为 这 些 系统 类 型 都 是 
最 有 可 能 遇 到 的 。 我 们 避免 类 似 的 书 中 存在 的 “个 人 计算 机 偏见 ”， 和 希望 学 生理 解 各 种 平台 在 
当今 的 自动 化 基础 设施 中 的 不 同 之 处 、 相 似 之 处 和 所 发 挥 的 作用 。 很 多 时 候 ， 教 材 忘记 了 动机 
也 许 是 学 习 中 一 个 最 重要 的 因素 。 为 此 ， 我 们 包括 了 许多 实际 的 例子 ， 同 时 试图 保持 理论 与 应 
用 之 间 的 平衡 。 

本 书 特 色 

本 书 的 很 多 特色 都 是 为 了 强调 计算 机 组 成 和 体系 结构 中 的 各 种 概念 ， 并 使 学 生 更 容易 理解 
相关 材料 。 这 些 特色 包括 : 

。 补充 材料 。 穿 搬 在 正文 中 的 补充 材料 包括 有 趣 的 信息 ， 这 些 信息 超出 了 相应 章 的 重点 
内 容 ， 方 便 读 者 进一步 探究 这 些 材料 。 
实际 的 例子 。 教 材 中 整合 了 来 自 现实 生活 的 例子 ， 使 学 生 更 好 地 理解 技术 是 如 何 与 实 
际 问题 相 结 合 的 。 

。 小 结 。 这 个 部 分 对 每 章 的 要 点 进行 了 简明 扼要 的 总 结 。 

。 扩展 阅读 。 这 个 部 分 为 希望 更 详细 研究 相关 主题 的 读者 列 出 了 额外 的 资源 ， 并 且 包 含 

了 与 该 章 主题 相关 的 权威 论文 和 书籍 的 引用 。 

。 复习 题 。 每 章 都 包含 一 套 复习 题 ， 方 便 读者 巩固 所 学 的 知识 。 

。 习题 。 每 章 都 有 可 供 选择 的 练习 ， 以 强化 所 介绍 的 概念 。 

。 精 选 习题 答案 与 提示 。 习 题 中 用 菱形 标示 的 问题 都 有 答案 。 

。 特别 关注 。 这 个 部 分 为 教师 提供 了 额外 的 信息 ， 例 如 卡 诺 图 和 数据 压缩 等 。 

。 附录 。 附 录 提 供 了 数据 结构 的 简要 介绍 ， 包 括 堆栈 、 链 表 和 树 等 主题 。 

作者 简介 

这 本 教材 不 仅 融合 了 我 们 超过 35 年 的 教学 经 验 ， 而 且 还 有 30 多 年 的 行业 经 验 。 因 此 ， 我 
们 不 仅 强调 计算 机 组 成 和 体系 结构 的 基本 原理 ， 而 且 把 这 些 主题 与 实践 相 结合 。 我 们 使 用 了 现 
实生 活 中 的 例子 ， 用 于 帮助 学 生理 解 这 些 基 本 概念 如 何 应 用 于 计算 领域 。 

Linda Null 从 艾 奥 瓦 州立 大 学 获得 了 计算 机 科学 硕士 和 博士 学 位 ， 从 西北 密苏里 州立 大 学 
获得 了 计算 机 科学 教育 硕士 学 位 、 数 学 教育 硕士 学 位 、 数 学 和 英语 学 士 学 位 。 她 已 经 从 事 数学 
和 计算 机 科学 教学 工作 超过 了 35 年， 目前 是 宾夕法尼亚 州立 大 学 哈里 斯 堡 校区 计算 机 科学 研 
究 生 课程 协调 员 和 课程 副 主 席 ， 从 1995 年 开始 她 一 直 是 那里 的 教师 。 她 已 经 获得 了 很 多 教学 
奖 ， 包 括 宾夕法尼亚 州立 大 学 杰出 教师 奖 和 优秀 教学 奖 。 她 感 兴趣 的 领域 包括 计算 机 组 成 和 体 
系 结 构 、 操 作 系 统 、 计 算 机 科学 教育 和 计算 机 安全 。 

Julia Lobur 是 一 名 在 计算 机 行业 工作 超过 30 年 的 从 业者 。 她 除了 兼职 教学 工作 外 ， 还 担任 
过 系统 顾问 、 高 级 程序 员 / 分 析 师 、 系 统 和 网 络 设计 师 、 软 件 开 发 经 理 和 项 目 经 理 等 职位 。 
Julia 获得 了 计算 机 科学 硕士 学 位 ， 并 且 是 一 名 IEEE 认证 的 软件 开发 专业 人 员 。 

预备 知识 

学 生 使 用 本 教材 前 需要 具有 一 年 使 用 高 级 过 程 语言 编写 程序 的 经 验 ， 也 应 该 学 过 一 年 的 大 


学 数学 ( 微 积 分 或 离散 数学 ) 。 本 教材 假定 之 前 学 生 不 了 解 计算 机 硬件 。 

计算 机 组 成 和 体系 结构 课程 通常 是 本 科 生 学 习 操 作 系 统 (学 生 必须 知道 存储 器 层次 结构 、 
并 发 、 异 常 和 中 断 ) 、 编 译 器 (学 生 必 须知 道 指令 集 、 存 储 器 地 址 和 链接 )、 网 络 ( 学 生 必须 理 
解 系统 的 硬件 ， 然 后 才能 理解 将 这 些 部 件 连接 在 一 起 的 网 络 ) 以 及 任何 高 级 计算 机 体系 结构 课 
程 之 前 的 选修 课 。 

本 书 的 组 织 结构 

在 本 教材 中 对 概念 的 介绍 方式 是 一 次 尝试 ， 即 简明 而 全 面 地 覆盖 我 们 认为 对 于 计算 机 科学 
专业 学 生 必 要 的 主题 。 我 们 不 认为 最 好 的 方式 是 “划分 ”各 种 主题 ， 因 此 ， 我 们 选择 了 一 种 
结构 化 的 整合 方式 ， 使 每 个 主题 都 包含 在 整个 计算 机 系统 的 背景 中 。 

与 许多 流行 的 教材 一 样 ， 我 们 采用 了 自 底 向 上 的 方法 ， 即 从 数字 逻辑 层 开 始 构 建 到 应 用 
层 ， 应 用 层 是 学 生 在 开始 学 习 这 门 课程 之 前 就 应 该 熟悉 的 。 当 读者 到 达 应 用 层 时 ， 计 算 机 组 成 
和 体系 结构 中 必要 的 概念 都 已 经 呈现 了 。 我 们 的 目标 是 让 学 生 把 本 书 中 涵盖 的 硬件 知识 与 在 程 
序 设计 导论 课程 中 学 到 的 概念 联系 到 一 起 ， 形 成 一 个 完整 而 全 面 的 硬件 和 软件 如 何 组 织 在 一 起 
的 画面 。 最 终 ， 硬 件 理解 程度 对 软件 设计 和 性 能 有 重大 的 影响 。 如 果 学 生 能 够 掌握 硬件 基本 知 
识 ， 将 有 助 于 成 为 更 好 的 计算 机 科学 家 。 

计算 机 组 成 和 体系 结构 中 的 概念 对 于 计算 机 专业 人 员 的 许多 日 常 工作 是 必需 的 。 为 了 处 
理 计算 机 专业 人 员 应 该 了 解 的 许多 领域 内 的 问题 ,我 们 采用 从 更 高 层次 看 计算 机 体系 结构 
的 方法 ， 仅 当 理 解 一 个 特定 概念 需要 低层 信息 时 才 给 出 这 些 信息 。 例如 ， 当 讨论 ISA 时 ,在 
不 同 的 案例 研究 背景 中 引入 了 许多 与 硬件 相关 的 问题 ， 这 不 仅 区 分 而 且 也 加 强 了 与 ISA 设计 
相关 的 问题 。 

本 书包 括 13 章 和 1 个 附录 ， 列 举 如 下 : 

。 第 1 章 对 计算 提供 了 一 般 性 的 历史 概述 ， 指 出 了 计算 系统 开发 中 的 许多 里 程 碑 ， 让 读 

者 了 解 我 们 是 如 何 达到 当前 的 计算 状态 的 。 本 章 介 绍 了 必要 的 术语 、 计 算 机 系统 中 的 
基本 部 件 、 计 算 机 系统 的 各 种 逻辑 层 和 冯 “ 诺 依 曼 计算 机 模型 ， 提 供 了 计算 机 系统 的 
高 层 视图 ， 以 及 进一步 研究 的 动机 和 必要 的 概念 。 

。 第 2 章 对 计算 机 使 用 的 表示 数字 和 字符 信息 的 各 种 方法 提供 了 全 面 讨论 。 一 旦 读者 接 
触 到 进 制 和 典型 的 数字 表示 技术 (包括 1 的 补 码 、2 的 补 码 和 BCD 码 等 ) ， 就 可 以 学 习 
加 、 减 、 乘 和 除 运 算 了 。 此 外 ， 也 介绍 了 EBCDIC、ASCII 和 Unicode 字符 表示 法 ， 以 
及 定点 和 浮 点 表示 法 。 对 于 错误 检测 与 纠 错 进行 了 简要 介绍 。 在 “特别 关注 ”中 描述 
了 数据 记录 和 传输 的 编码 。 

。 第 3 章 是 数字 人 逻辑 的 经 典 表示 及 其 与 布尔 代数 的 关系 。 本 章 详 细 介 绍 了 组 合 逻 辑 和 时 序 
逻辑 ， 以 使 读者 能 够 理解 更 复杂 的 MSI( 中 等 规模 集成 ) 电 路 ( 如 译 码 右 ) 的 逻辑 组 成 。 更 
复杂 的 电路 (如 总 线 和 存储 器 ) 也 包括 在 内 。 优 化 和 卡 诺 图 包含 在 “特别 关注 ”中 。 

。 第 4 章 解 释 了 基本 的 计算 机 组 成 并 且 介 绍 了 许多 基本 概念 ， 包 括 取 指 - 译 码 - 执行 周期 、 
数据 通路 、 时 钟 和 总 线 、 寄 存 器 传输 表示 和 CPU。 介 绍 了 一 种 非常 简单 的 MARIE 体系 结 
构 及 其 ISA， 使 读者 对 基本 体系 结构 (包括 程序 执行 ) 有 了 全 面 理解 。MARIE 展示 了 经 典 
的 汉 … 诺 依 曼 设 计 ， 包 括 一 个 程序 计数 器 、 一 个 累加 器 、 一 个 指令 寄存 器 、4096 字 节 的 
存储 器 和 两 种 寻 址 方式 。 为 了 强化 早 些 时 候 提出 的 指令 格式 、 指 令 模式 、 数 据 格式 和 控 
制 等 概念 ， 还 介绍 了 汇编 语言 程序 设计 。 本 书 不 是 一 本 汇编 语言 教材 ， 也 不 是 为 汇编 
语言 程序 设计 而 设计 的 实践 课程 。 介 绍 汇编 的 主要 目的 是 进一步 从 总 体 上 理解 计算 机 
体系 结构 。 我 们 为 MARIE 提供 了 一 个 仿真 器 ， 这 样 就 可 以 在 MARIE 体系 结构 上 编写 、 
编译 和 运行 汇编 语言 程序 了 。 本 章 介 绍 和 比较 了 控制 的 两 种 方法 : 硬 连 线 和 微 程序 。 


最 后 ， 比 较 了 Intel 和 MIPS 体系 结构 ， 以 强化 本 章 介 绍 的 概念 。 
。 第 5 章 对 指令 集 架构 进行 了 更 深入 的 考察 ， 包 括 指令 格式 、 指 令 类 型 和 寻 址 方式 ， 还 
介绍 了 指令 级 流水 线 。 给 出 了 实际 的 ISA( 包 括 Intel 和 MIPS 技术 、ARM 、Java) ， 以 强 
化 本 章 中 的 概念 。 
。 第 6 章 讨论 了 存储 器 的 基本 概念 ， 如 RAM 和 各 种 存储 设备 ， 也 讨论 了 更 高 级 的 存储 器 
层次 结构 的 概念 ， 包 括 高 速 缓存 和 虚拟 存储 器 。 本 章 对 高 速 缓存 的 直接 映射 、 全 相 联 
映射 和 组 相 联 映射 技术 进行 了 全 面 介 绍 ， 还 详细 介绍 了 分 页 和 分 段 、TLB 以 及 与 每 种 
技术 相关 的 各 种 算法 和 设备 。 
。 第 7 章 介绍 了 LO 原理 、 总 线 通信 协议 、 典 型 的 外 部 存储 设备 (如 磁盘 和 光盘 ) ， 以 及 
每 种 设备 可 用 的 各 种 格式 ， 也 涉及 DMA 、 编 程控 制 IO 和 中 断 。 另 外 介绍 了 在 设备 之 
间 交 换 信息 的 各 种 技术 ， 详 细 介 绍 了 RAID 体系 结构 。 在 “特别 关注 ”中 介绍 了 各 种 
数据 压缩 格式 。 
。 第 8 章 讨论 了 各 种 可 用 的 编程 工具 ( 如 编译 器 和 汇编 程序 ) 以 及 它们 与 程序 所 运行 的 机 
髓 体系 结构 之 间 的 关系 。 本 章 的 目标 是 把 计算 机 系统 程序 员 的 观点 与 底层 机 器 的 实际 
硬件 和 体系 结构 联系 在 一 起 。 另 外 ， 介 绍 了 操作 系统 ， 但 是 仅 涵盖 应 用 到 一 个 系统 中 
的 体系 结构 和 组 成 方面 的 更 多 细节 (如 资源 使 用 和 保护 、 陷 阱 和 中 断 以 及 各 种 其 他 
服务 ) 。 
。 第 9 章 对 近年 来 出 现 的 其 他 体系 结构 进行 了 概述 ， 涵 盖 RISC 、Flynn 分 类 法 、 并 行 处 理 
器 、 指 令 级 并 行 、 多 处 理 器 、 互 连 网 络 、 共 享 存储 系统 、 高 速 缓存 一 致 性 、 存 储 模型 、 
超标 量 机 、 神 经 网 络 、 数 据 流 计算 机 、 量 子 计 算 和 分 布 式 体系 结构 。 本 章 的 主要 目的 
是 帮助 读者 认识 到 我 们 不 局 限于 冯 “' 诺 依 曼 体 系 结构 ， 并 引导 读者 考虑 性 能 问题 ， 为 
下 一 章 做 好 准备 。 
。 第 10 章 讨论 了 前 面 章 节 中 没有 涵盖 的 舱 入 式 系统 中 的 概念 和 主题 。 具 体 来 说 ， 本 音 关 
注 藤 入 式 硬件 和 组 件 、 伐 和 人 式 系统 设计 主题 、 骨 入 式 软件 构建 基础 和 骨 人 入 式 操 作 系 统 
特征 。 
。 第 11 章 涉及 各 种 性 能 分 析 和 管理 问题 ， 介 绍 了 必要 的 数学 知识 ， 随 后 讨论 了 MIPS、 
FLOPS、 基 准 测试 和 各 种 优化 问题 。 计 算 机 科学 家 应 该 熟悉 这 些 优 化 问题 ， 包 括 分 支 
预测 、 推 测 执行 和 循环 优化 。 
。 第 12 章 关注 网 络 的 组 成 和 体系 结构 ， 包 括 网 络 组 件 和 协议 ， 在 因特网 背景 中 介绍 了 
OSI 模型 和 TCP/ZP。 本 章 的 目的 绝 不 是 全 面 介绍 网 络 ， 而 是 将 计算 机 体系 结构 置 于 相 
对 于 网 络 体系 结构 的 正确 环境 中 。 
。 第 13 章 介绍 了 一 些 流 行 的 适合 于 大 型 和 小 型 系统 的 IO 架构 ， 包 括 SCSI、ATA 、IDE、 
SATA、PCI、USB 和 正 EE 1394。 本 章 也 概述 了 存储 区 域 网 络 和 云 计 算 。 
。 附录 A 是 关于 数据 结构 的 简短 介绍 ， 因 为 在 一 些 情况 下 学 生 可 能 需要 复习 堆栈 、 队 列 
和 链表 等 主题 。 
教学 时 可 以 按照 书 中 的 先后 顺序 进行 。 然 而 ， 如 果 有 需要 ， 教 师 可 以 修改 这 个 顺序 以 便 更 
好 地 适合 于 给 定 的 课程 。 图 P-1 给 出 了 各 章节 之 间 的 关系 。 

第 4 版 中 的 新 内 容 

自 本 书 第 3 版 出 版 以 来 ， 计 算 机 体系 结构 领域 在 不 断 发 展 。 在 第 4 版 中 ， 除 了 前 面 三 版 中 
已 经 介绍 的 主题 外 ， 我 们 纳入 了 许多 新 变化 。 在 第 4 版 中 ,我们 的 目标 是 更 新 内 容 和 参考 文 
献 、 增 加 新 的 材料 、 基 于 读者 的 评论 扩展 当前 的 讨论 并 且 增加 核心 章节 中 练习 的 数量 。 虽 然 不 
能 列 出 这 一 版 中 所 有 的 变化 ， 但 是 下 面 的 列表 突出 了 读者 可 能 感 兴趣 的 主要 变化 。 
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图 P-1 各 章 之 间 的 关系 


第 1 章 已 经 更 新 ， 包括 新 的 例子 和 人 解释、 平板 电脑 、 计 算 即 服务 ( 云 计 算 ) 和 认 知 计算 。 
硬件 概述 已 经 扩展 和 更 新 (值得 注意 的 是 ， 删 除了 对 CRT 的 讨论 ， 增 加 了 对 图 形 卡 的 
讨论 ) 并 且 增 加 了 补充 材料 。 更 新 了 非 冯 “' 诺 依 曼 模 型 ， 并 且 新 增 了 并 行 性 部 分 。 章 后 
练习 的 数量 增加 了 26% 。 

第 2 章 包含 移 码 表示 法 。 之 前 的 简单 模型 已 经 修改 为 使 用 标准 格式 ， 并 且 增 加 了 更 多 
的 例子 。 本 章 练习 的 数量 增加 了 44% 。 

第 3 章 已 经 改 用 “号 代替 上 划 线 (-) 表 示 非 运算 符 。 添 加 了 时 序 图 ， 以 帮助 解释 时 序 
电路 的 操作 。 扩 展 了 FSM 部 分 的 内 容 ， 包 括 附加 练习 。 

第 4 章 扩 展 了 存储 器 组 织 ( 包 括 存储 器 交叉 存 取 ) 内 容 ， 包 括 附加 的 例子 和 练习 。 我 们 
现在 使 用 “0x” 符 号 表示 十 六 进 制 。 在 硬 连 线 和 微 程 序 控制 方面 增加 了 更 多 细节 的 讨 
论 ， 并 更 新 了 MARIE 硬 连 线 控制 单元 的 逻辑 图 和 MARIE 微 程序 时 序 图 。 

第 5 章 除 了 新 的 ARM 处 理 器 部 分 外 ， 还 扩展 了 大 端 和 小 端 内 容 ， 包 括 附 加 例子 和 
练习 。 

第 6 章 更 新 了 图 ， 扩 展 了 全 相 联 存储 器 的 讨论 ， 包 括 附 加 的 例子 ， 更 明确 讨论 了 高 速 
缓存 。 所 有 例子 都 更 新 了 ， 用 十 六 进 制 地 址 取代 了 十 进 制 地 址 。 本 章 现在 包含 的 例子 
比 第 3 版 多 20% 。 

第 7 章 扩 展 了 固态 硬盘 和 新 兴 的 数据 存储 设备 ( 如 碳 纳米 管 和 忆 阻 器 ) 的 讨论 ， 还 增加 
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了 RAID 的 内 容 。 除 了 章 后 练习 数量 增加 20% 外 ， 还 增加 了 MP3 压缩 方面 的 内 容 。 
。 第 8 章 已 经 更 新 ， 以 反映 系统 软件 领域 的 发 展 。 
e 第 9 章 扩展 讨论 了 RISC 与 CISC( 把 两 者 的 比较 融和 人 了 移动 领域 ) ， 还 讨论 了 量子 计算 
(包括 技术 奇 点 的 讨论 ) 。 
。 第 10 章 包 含 对 租 入 式 操作 系统 的 更 新 材料 。 
。 第 12 章 已 经 更 新 ， 删除 了 过 时 的 材料 ， 整 合 了 新 材料 。 
。 第 13 章 扩展 和 更 新 了 USB 的 内 容 ， 扩 展 了 云 存储 的 内 容 ， 删 除了 过 时 的 材料 。 
读者 对 象 
本 书 最 初 是 为 计算 机 科学 专业 本 科 生 的 计算 机 组 成 与 体系 结构 课程 编写 的 。 虽 然 本 书面 回 
计算 机 科学 专业 ， 但 是 也 适用 于 本 和 I 专业 的 学 生 。 
本 书包 含 的 材料 对 于 典型 的 一 学 期 课程 绰 引 有余。 但是， 一般 学 生 无 法 在 一 学 期 课程 中 掌 
握 本 书 的 所 有 材料 。 如 果 教 师 计 划 覆 盖 所 有 主题 ， 那 么 最 理想 的 是 连续 两 个 学 期 的 课程 。 这 种 
组 织 方式 使 教师 可 以 根据 学 生 的 经 验 和 需求 ， 以 不 同 深度 覆盖 重要 的 主题 。 教 师 覆 盖 这 些 主题 
所 需 时 间 的 建议 如 表 P-2 所 示 ， 其 中 还 列 出 了 完成 每 一 章 的 相应 期 望 程度 。 我 们 希望 本 书 在 正 
式 课 程 学 完 后 的 很 长 一 段 时 间 里 都 会 成 为 有 用 的 参考 书 。 
表 P-2 建议 学 时 



























































| : 1 二 个 学 期 (4 和 2 党 时 ) eh 
A 的 
1 3 精通 3 精通 
2 6 精通 6 精通 
3 6 精通 6 精通 
8 精通 8 精通 
熟悉 6 精通 
熟悉 8 精通 
熟悉 6 精通 
a 2 了 解 7 
3 熟悉 精通 
10 le 1 了 解 2 
11 人 2 丁 解 
3 了 解 精通 
了 解 6 精通 














教学 模型 : MARIE 

在 关于 计算 机 组 成 与 体系 结构 的 书 中 ,体系 结构 模型 的 选择 既 会 影响 教师 ， 也 会 影响 学 
生 。 如 果 模 型 太 复杂 ， 那 么 教师 和 学 生 都 会 陷入 与 课堂 所 讲 概念 无 关 的 细节 中 。 虽 然 真 实 的 体 
系 结构 令 人 感 兴趣 ,但 是 把 这 些 体系 结构 用 于 入 门 课程 中 往往 会 有 太 多 的 独特 之 处 。 真 实 的 体 
系 结构 每 天 都 在 变 ， 这 使 得 事情 变 得 更 加 复杂 。 另 外 ， 很 难 找到 一 本 书 ， 其 所 包含 的 模型 与 某 
个 学 院 中 的 本 地 计算 平台 相 匹配 ， 值 得 注意 的 是 ， 这 个 平台 也 可 能 每 年 都 会 变化 。 

为 了 缓解 这 些 问 题 ， 我 们 设计 了 专门 用 于 教学 的 简单 体系 结构 MARIE。 利 用 MARIE， 学 
生 学 习 计算 机 组 成 与 体系 结构 的 基本 概念 (包括 汇编 语言 ) 时 ， 不 会 陷 人 存在 于 真实 体系 结构 
中 的 不 必要 和 混乱 的 细节 中 。 尽 管 MARIE 很 简单 ， 但 是 它 却 仿真 了 一 个 功能 系统 。MarieSim 
是 MARIE 机 的 仿真 器 ， 具 有 用 户 友好 的 图 形 用 户 界面 ， 利 用 它 ， 学 生 可 以 创建 和 编辑 源 代 码 ， 


将 源 代 码 转 换 为 机 器 码 ， 运 行 机 器 码 ， 调 试 程序 。 
有 具体 而 言 ，MarieSim 具有 以 下 特点 : 
。 对 第 4 章 中 引入 的 MARIE 汇编 语言 的 支持 
。 用 于 程序 创建 和 修改 的 集成 文本 编辑 器 
。 十 六 进 制 机 器 语言 目标 代码 
。 带 有 单 步 模式 、 断 点 、 暂 停 、 恢 复 以 及 寄存 器 与 存储 器 跟踪 的 集成 调试 器 
。 显示 MARIE 存储 器 中 4096 个 地 址 的 图 形 存储 器 监控 器 
。 MARIE 寄存 器 的 图 形 显示 
。 在 程序 执行 期 间 加 亮 指令 
。 用 户 控制 的 执行 速度 
。 状态 消息 
e 用 户 可 见 的 符号 表 
。 让 用 户 改正 任何 错误 和 自动 重新 汇编 而 不 改变 环境 的 交互 式 汇 编 器 
。 在 线 帮助 
。 可 选 的 内 核 转 储 ， 用 户 可 以 指定 存储 器 范围 
。 用 户 可 以 修改 的 帧 大 小 
。 平缓 的 学 习 曲 线 ， 学 生 可 以 快速 学 会 使 用 这 个 系统 
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由 于 MarieSim 是 使 用 Java 语言 编写 的 ， 所 以 这 个 系统 可 以 移植 到 任何 使 用 Java 虚拟 机 
(JVM) 的 平台 上 。 学 过 Java 的 学 生 可 以 查看 这 个 仿真 器 的 源 代 码 ， 甚 至 可 以 对 仿真 器 的 简单 功 


能 进行 改进 和 强化 。 


图 P-2 是 MarieSim 的 图 形 化 环境 ， 图 中 展示 了 MARIE 机 仿真 器 的 图 形 化 环境 。 该 截图 包 


含 4 个 部 分 : 菜单 栏 、 中 央 监 控 区 、 存 储 器 监控 器 和 消息 区 。 


LOAD 
SUBT 
OUTPUT 
STORE 
SUBT 
SKIPCOND 
JUNP 
HALT 
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1l00p 400C 400B 8400 0020 0001 0006 
0000 0000 0000 0000 0000 0000 
0000 0000 0000 0000 0000 0000 
0000 0000 0000 0000 0000 0000 
0000 0000 0000 0000 0000 0000 
0000 0000 0000 0000 0000 0000 
0000 0000 0000 0000 0000 0000 
0000 0000 0000 0000 0000 0000 
0000 0000 0000 








图 P-2 MarieSim 的 网 形 化 环境 


菜单 选项 允许 用 户 控制 MARIE 仿真 器 系统 的 活动 和 行为 。 这 些 选 项 包括 加 载 
止 、 设 置 断 点 和 暂停 已 经 用 MARIE 汇编 语言 编写 好 的 程序 。 


、 启 动 、 停 


MARIE 仿真 器 在 一 个 简单 环境 中 展示 了 汇编 过 程 、 加 载 和 执行 。 用 户 能 够 直接 看 到 程序 
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的 汇编 语言 状态 ， 以 及 相应 的 机 器 码 (十 六 进 制 ) 。 这 些 指令 的 地 址 也 可 显示 出 来 ， 用 户 能 
在 任何 时 间 看 到 存储 器 的 任何 部 分 。 加 亮 用 于 指示 程序 的 初始 加 载 地 址 ， 以 及 当 程 序 运 行 时 所 
执行 的 当前 指令 。 寄 存 器 和 存储 器 的 图 形 显示 使 学 生 可 以 看 到 指令 是 如 何 引 起 寄存 器 和 存储 器 
的 值 变化 的 。 

如 果 发 现 了 错误 

我 们 试图 使 本 书 准确 ， 但 是 即使 已 经 进行 了 多 次 检查 ， 也 还 是 会 有 错误 。 我 们 非常 感谢 发 
现任 何 错误 的 读者 ， 意 见 和 建议 请 发 送 电子 邮件 到 ECOA@ jblearning. com。 

致谢 
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绪 论 





1.1 引言 

有 许多 人 把 计算 机 革命 看 作 一 种 自然 力量 ，Negroponte 博士 是 其 中 的 一 个 。 这 种 力量 潜在 
地 把 人 类 带 入 了 数字 社会 ， 使 我 们 可 以 攻克 已 经 逃避 了 几 个 世纪 的 问题 ， 以 及 在 解决 问题 时 出 
现 的 所 有 新 问题 。 计 算 机 已 经 把 我 们 从 单调 的 常规 任务 中 解放 出 来 ， 释 放出 了 我 们 的 创造 潜 
力 ， 所 以 我 们 能 建造 更 大 和 更 好 的 计算 机 。 

当 观 察 计算 机 带 来 的 科学 和 社会 的 深刻 变革 时 ， 我 们 很 容易 感到 由 于 计算 机 的 复杂 性 带 来 
的 压力 。 这 种 复杂 性 是 由 一 些 非常 简单 的 基础 性 概念 构成 的 。 这 些 简单 的 概念 已 经 把 我 们 带 到 
了 今天 ,并 且 它 们 是 未 来 计算 机 的 基础 。 将 来 这 些 概念 是 否 能 继续 存在 ,不 得 而 知 。 但 是 今 
天 ， 它 们 是 所 有 计算 机 科学 的 基础 。 

计算 机 科学 家 通常 更 关心 编写 复杂 的 程序 算法 ， 而 不 是 设计 计算 机 硬件 。 当 然 ， 如 果 想 让 
算法 有 用 ， 还 是 要 让 计算 机 运行 这 些 算 法 的 。 一 些 算 法 非常 复杂 ， 以 至 于 在 今天 的 计算 机 系统 
上 运行 它们 要 花费 很 长 的 时 间 。 这 些 算 法 被 认为 是 不 可 计算 的 算法 。 当 然 ， 以 目前 的 创新 速度 
来 看 ， 一 些 今天 不 可 能 的 事情 ， 明 天 将 是 可 能 的 事情 。 但 是 ， 无 论 计 算 机 变 得 多 大 或 者 多 快 ， 
人 们 还 是 会 想 出 超出 计算 机 合理 极限 的 问题 。 

若 想 理解 一 个 算法 为 什么 是 不 可 行 的 ， 或 者 理解 一 个 可 行 的 算法 为 什么 运行 得 太 慢 ， 你 必 
须 能 够 从 计算 机 的 观点 来 看 这 个 程序 。 在 试图 优化 正在 运行 的 程序 之 前 ， 你 必须 理解 是 什么 让 
计算 机 系统 做 出 这 样 的 反应 的 。 不 先 理解 计算 机 系统 就 试图 优化 它 ， 就 像 不 懂 汽 车 却 试图 修理 
汽车 一 样 ， 只 能 是 磁 运 气 了 。 

优化 程序 和 维护 系统 或 许 是 学 习 计 算 机 如 何 工作 的 最 重要 动机 。 实 际 上 ， 还 有 许多 其 他 原 
因 。 例 如 ， 如 果 你 想 编 写 一 个 编译 器 ， 那 么 你 必须 理解 在 硬件 环境 中 编译 器 所 发 挥 的 作用 。 最 
好 的 编译 器 会 利用 特别 的 硬件 特性 (比如 流水 线 ) 来 获得 更 高 的 速度 和 效率 。 

如 果 你 需要 对 一 个 大 的 、 复 杂 的 真实 系统 建 模 ， 那 么 你 需要 知道 如 何 处 理 浮 点 算法 ， 以 及 
实际 上 它 是 如 何 工作 的 。 如 果 你 希望 设计 外 围 设备 或 者 驱动 外 围 设备 的 软件 ， 那 么 你 必须 知道 
计算 机 如 何 处 理 输入 /输出 (0) 的 每 一 个 细节 。 如 果 你 的 工作 包含 垦 和 人 式 系统 ， 那 么 你 需要 
知道 这 些 系 统 通常 都 是 资源 受 限 的 。 对 时 间 、 空 间 、 价 格 折 中 以 及 VO 架构 的 理解 ， 对 你 的 职 
业 来 说 是 必 不 可 少 的 。 

所 有 计算 机 专业 人 士 都 应 该 熟悉 基准 测试 的 概念 ， 能 够 解释 和 说 明基 准 测 试 系 统 的 结果 。 
在 研究 工作 中 涉及 硬件 系统 、 网 络 或 算法 的 人 会 发 现 基 准 测试 技术 对 他 们 的 日 常 工作 很 重要 。 
负责 购买 硬件 的 技术 经 理 也 使 用 基准 测试 技术 ， 以 便 用 给 定 的 经 费 买 到 最 好 的 系统 。 记 住 ， 性 
能 基准 测试 方法 可 能 会 被 操纵 以 使 结果 有 利于 特定 系统 。 

前 面 的 例子 解释 了 这 样 的 思想 ， 即 计算 机 硬件 与 程序 和 软件 部 件 的 许多 方面 存在 着 基本 的 
联系 。 因 此 ， 不 管 我 们 的 专业 领域 是 什么 (比如 计算 机 科学 家 ) ， 都 需要 理解 硬件 和 软件 的 相 
互 作 用 。 我 们 必须 熟悉 如 何 使 各 种 电路 和 部 件 相配 合 以 创建 出 计算 机 系统 。 通 过 学 习 计算 机 组 
织 (computer organization ， 或 计算 机 组 成 ) 可 以 了 解 如 何 创 建 计 算 机 系统 。 计 算 机 组 织 处 理 控制 
信和 号 (如 何 控 制 计 算 机 )、 信 号 方法 和 存储 类 型 等 问题 。 计 算 机 组 织 包括 计算 机 系统 的 所 有 物 
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理 方 面 ， 它 能 帮助 我 们 回答 计算 机 如 何 工作 的 问题 。 

男 一 方面 ， 计 算 机 体系 结构 (computer architecture， 或 计算 机 系统 结构 ) 集 中 于 计算 机 体系 
结构 和 行为 的 研究 ， 是 从 程序 员 的 角度 看 到 的 系统 实现 的 逻辑 和 抽象 。 计 算 机 体系 结构 包括 许 
多 元 素 ， 比 如 指令 集 和 指令 格式 、 操 作 码 、 数 据 类 型 、 寄 存 器 的 数值 和 类 型 、 寻 址 方式 、 主 存 
访问 方法 和 各 种 VO 机 制 。 系 统 的 体系 结构 直接 反映 了 程序 的 逻辑 执行 。 学 习 计 算 机 体系 结构 
可 以 帮助 我 们 解决 如 何 设 计 计 算 机 的 问题 。 

给 定 机 器 的 计算 机 体系 结构 是 硬件 部 件 与 指令 集 架 构 ( Instruction Set Architecture，ISA ) 的 
集合 。ISA 是 机 器 上 运行 的 软件 与 执行 软件 的 硬件 之 间 共 同 认 可 的 接口 ，ISA 允许 你 与 机 器 
对 话 。 

计算 机 组 织 与 计算 机 体系 结构 之 间 的 区 别 并 不 明显 。 对 于 如 何 准确 地 区 分 哪些 概念 属于 计 
算 机 组 织 和 哪些 概念 属于 计算 机 体系 结构 ， 计 算 机 科学 领域 的 人 们 和 计算 机 工程 领域 的 人 们 持 
有 不 同 的 观点 。 事 实 上 ， 不论 是 计算 机 组 织 还 是 计算 机 体系 结构 都 不 是 孤立 的 ， 它们 相互 关 
联 、 相 互 依赖 。 只 有 在 理解 了 两 者 之 后 ， 我 们 才能 够 真正 理解 它们 中 的 每 一 个 。 对 计算 机 组 成 
和 体系 结构 的 理解 必然 能 够 引导 我 们 更 深入 地 理解 计算 机 ， 以 及 更 深入 地 理解 被 认为 是 计算 机 
科学 核心 和 灵魂 的 计算 。 


1.2 计算 机 的 主要 部 件 

区 分 哪些 概念 属于 计算 机 组 织 和 哪些 概念 属于 计算 机 体系 结构 有 些 困 难 ， 并 且 不 可 能 说 清 
楚 哪 里 是 硬件 问题 的 结束 以 及 哪里 是 软件 问题 的 开始 。 计 算 机 科学 家 设计 算法 ， 这 些 算法 通常 
是 用 计算 机 语言 (比如 Java 或 者 C ++ ) 写成 的 程序 实现 的 。 但 是 ， 算 法 怎么 才能 运行 ?当然 是 
使 用 其 他 算法 运行 这 个 算法 ， 如 此 这 般 直 到 降 到 机 器 层 ， 在 这 里 可 以 认为 是 用 一 个 电子 设备 实 
现 了 一 个 算法 。 因 此 ， 现 代 计 算 机 实际 上 是 执行 其 他 算法 的 算法 实现 。 这 个 嵌 套 算法 链 使 我 们 
得 到 下 列 原理 : 

硬件 和 软件 等 价 原理 : 任何 由 软件 完成 的 任务 也 能 使 用 硬件 完成 ， 并 且 任 何 直接 由 硬件 完 
成 的 操作 也 可 以 使 用 软件 完成 。S 

一 台 专 用 计算 机 能 够 设计 用 来 执行 任何 任务 ， 比 如 字 处 理 、 预 算 分 析 或 者 玩 俄罗斯 方块 游 
戏 。 相 应 地 ， 也 可 以 编写 程序 来 执行 专用 计算 机 的 功能 ， 比 如 装 在 汽车 或 微波 炉 中 的 嵌入 式 系 
统 。 有 些 时 候 ， 一 个 简单 的 嵌入 式 系统 比 一 个 复杂 的 计算 机 程序 有 更 好 的 性 能 ， 有 些 时 候 ， 程 
序 是 优先 选择 的 方法 。 硬 件 和 软件 等 价 原理 告诉 我 们 : 需要 做 出 选择 。 计 算 机 组 成 和 体系 结构 
的 知识 有 助 于 我 们 做 出 最 好 的 选择 。 

我 们 从 构成 计算 系统 的 主要 部 件 开 始 讨论 计算 机 硬件 。 在 最 基本 的 层面 ， 计 算 机 由 三 部 分 
组 成 : 

1. 一 个 用 于 解释 和 执行 程序 的 处 理 器 。 

2. 一 个 用 于 存储 数据 和 程序 的 存储 器 。 

3. 一 种 用 于 与 外 部 世界 传输 数据 的 机 制 。 

在 接 下 来 的 章节 中 ， 我 们 详细 讨论 与 计算 机 硬件 相关 的 这 三 种 部 件 。 

一 旦 根据 计算 机 的 部 件 理解 了 计算 机 ， 你 就 能 够 理解 一 个 系统 在 所 有 时 刻 所 做 的 事情 ， 并 
且 如 果 需 要 的 话 ， 你 能 够 知道 如 何 改变 它 的 行为 。 你 甚至 可 能 会 感到 你 有 一 些 地 方 与 计算 机 有 
共同 点 ， 这 种 想法 并 非 不 着 边际 。 想 想 一 个 坐 在 教室 的 学 生 如 何 展示 计算 机 的 三 种 部 件 : 学 生 
的 大 脑 是 处 理 器 ， 笔 记 本 代表 存储 器 ， 记 笔记 的 铅笔 或 钢笔 就 是 IO 机 制 。 但 是 记 住 ， 你 的 能 


加 ”这 个 原理 并 不 能 解决 等 价 任务 的 执行 速度 的 问题 ， 硬 件 实现 总 是 更 快 一 些 。 





力 远 超 过 今天 或 可 预期 未 来 的 任何 一 台 计算 机 的 能 力 。 


1.3 一 个 实例 系统 : 吃力 地 读 专 业 词 汇 

下 面 将 介绍 一 些 计 算 机 的 特殊 词汇 。 这 些 专业 词汇 可 能 是 混 消 、 不 精确 和 令 人 生 旦 的 。 我 
们 相信 ， 只 要 解释 一 下 就 能 消除 迷雾 。 

为 了 方便 讨论 ， 我 们 找 了 一 个 计算 机 广告 ( 见 图 1-1)。 这 是 一 个 典型 的 计算 机 广告 ， 广告 
中 出 现 了 一 大 堆 像 “32GB DDR3 SDRAM”“PCIe 声卡 ”和 “128KB L1 高 速 缓存 ”等 短语 ， 这 
就 像 是 对 用 户 进行 了 一 番 短 语 稻 炸 。 如 果 不 能 理解 这 样 的 专业 词汇 ， 那 么 就 难以 知道 这 个 系统 
是 不 是 你 想 购 买 的 ， 甚 至 难以 知道 这 个 系统 是 不 是 能 够 满足 需求 。 随 着 内 容 的 展开 ， 你 将 学 习 
到 这 些 词汇 背后 的 概念 。 


待 售 : 老式 计算 机 一 一 便宜 ! 便宜 ! 便宜 ! 


。Intel i7 四 核 ，3.9GHz 

。 1600MHz 32GB DDR3 SDRAM 

，128KB L1 高 速 缓存 ，2MB L2 高 速 缓存 

*。 1TB SATA 硬盘 驱动 器 ( 7200r/min ) 

。10 个 USB 端口 ，1 个 串 行 口 ，4 个 PCI 扩 展 槽 ( 1 个 PCI、 
1 个 PCIx16、2 个 PCIx1 ) ， 蓝 牙 ，HDMI 

“。24 ( lin=0.0254m ) 宽屏 LCD 显 示 器 ，16;:10 宽 高 比 ， 
1920x1200WUXGA ，300cd/m2， 主 动 矩 阵 ，1000:1 
(静态 ) ，8ms，24 位 彩色 ( 1670 万 种 颜色 ) ，VGA/VDVI 
输入 ，2 个 USB 端 口 

，]6xCD/DVD +/- RW 驱动 器 

。] GB PCIe 视频 卡 

*。 PCIe 声卡 

。 集 成 10/100/1000 网 卡 





图 1-1 一 则 典型 的 计算 机 广告 


在 解释 这 个 广告 之 前 ， 需 要 讨论 一 些 很 基本 的 概念 : 在 学 习 计 算 机 的 过 程 中 将 碰 到 的 测量 
专业 术语 。 

好 像 每 个 领域 都 有 自己 的 测量 方法 。 计 算 机 领域 也 不 例外 。 人 们 在 相互 谈论 计算 机 的 容量 
多 大 、 速 度 多 快 时 ， 必 须 使 用 相同 的 测量 单位 。 表 1-1 中 给 出 了 计算 机 中 常用 的 前 级 。20 世纪 
60 年 代 ， 因 为 2 的 某 个 寡 值 接近 10 的 某 个 寡 值 ， 所 以 就 赋予 它们 相同 的 前 缀 名 。 例 如 ，2"” 接 
近 10?， 所 以 就 用 “ 千 ” 表 示 它 。 这 样 做 造成 了 混淆 : 给 定 一 个 前 级 是 表示 10 的 寡 值 ， 还 是 表 
示 2 的 寡 值 呢 ? 一 千 的 意思 是 10 还 是 2"? 虽然 对 于 这 个 问题 没有 明确 的 答案 , 但 是 有 大 家 接 
受 的 “使 用 标准 ”。10 的 短 次 方 前 级 通常 用 于 表示 功率 、 电 压 、 频 率 ( 比如 计算 机 的 时 钟 速度 ) 
和 位 的 倍数 (比如 用 bit/s 表示 数据 传输 速度 ) 。 如 果 你 的 老式 调制 解 调 器 以 28. 8kbit/s 的 速率 
传输 ， 那 么 它 每 秒 传输 28 800 位 ( 即 28. 8 x10 )。 这 里 使 用 小 写字 母 “k” 代 表 10*, 使 用 小 写 
字母 “bit” 代 表 位 。 大 写字 母 “K” 用 于 2 的 短 次 方 前 级 ， 表 示 1024。 如 果 一 个 文件 的 大 小 是 
2KB， 那 么 它 就 是 2 x2" 字 节 ( 即 2048 字 节 ) 。 这 里 大 写字 母 “B” 代 表 字 节 。 如 果 一 个 磁盘 容 
量 为 1MB， 那 么 它 可 以 容纳 2” 字 节 信 息 。 

不 了 解 特 定 前 级 是 用 于 2 的 寡 次 方 还 是 10 的 寡 次 方 就 会 非常 容易 混淆 。 基 于 这 个 原因 ， 
国际 电工 委员 会 (IEC) 在 美国 国家 标准 和 技术 局 ( NIST) 的 帮助 下 ， 对 二 进 制 前 缀 给 出 了 标准 的 
名 字 和 符号 ， 以 区 别 于 十 进 制 前 级 。 每 一 个 前 级 是 在 表 1-1 所 示 给 定 的 符号 后 增加 一 个 “i”。 
例如 ，2" 重 新 命名 为 “kibi”( 即 kilobinary ) 并 且 用 符号 Ki 表示 。 与 此 类 似 ，2” 是 mebi 或 Mi， 





随后 是 gibi( Gi) 、tebi( Ti) 、pebi(Pi) 、exbi(Ei) 等 。 所 以 ， 单 词 mebibyte 表示 2” 字 节 ， 代替 了 
传统 意义 上 的 megabyte。 


表 1-1 与 计算 机 组 成 和 体系 结构 相关 的 通用 前 组 





























前 组 前 缀 

下 K 毫 

兆 M 105 pg 微 hk 05 2 
寺 6 10? 2 纳 n 0 2 
太 时 10! 30 皮 p (0 pi 
拍 P 105 2 飞 f 上 2 
区 10% | 2 阿 a 0 2 
泽 Z 102 A 大 Zz 0 SS 
苇 Y j02 2 公 y LO 和 2 


























这 些 新 前 缀 的 使 用 还 比较 少 。 对 于 计算 机 用 户 来 说 这 是 不 幸 的 事 ， 因 为 新 符号 对 理解 这 些 
前 级 的 真正 含义 是 重要 的 。1KB 存储 器 通常 是 1024 字 节 存储 器 ， 而 不 是 1000 字 节 存储 器 。 然 
而 ，1GB 磁盘 驱动 器 可 能 实际 上 是 10 亿 字 节 而 不 是 2" 字 节 ( 这 就 意味 着 你 得 到 的 存储 器 比 你 
想象 的 要 少 ) 。 所 有 3.5 英寸 ji，1lin =0. 0254m) 软 盘 标注 的 存储 数据 量 都 是 1.44MB ， 但 是 实 
际 上 可 以 存储 1440KB( 或 者 1440 x 2 = 1 474 560 字 节 ) 。 只 有 阅读 制造 商 的 说 明 书 才能 确切 地 
知道 IK、1KB 或 1G 所 表示 的 含义 。 补 充 材料 “ 当 GB 的 含义 不 一 样 时 ……” 是 一 个 说 明 新 前 
级 重要 的 好 例子 。 


谁 使 用 以 ZB 和 YB 为 单位 的 容量 ? 


美国 国家 安全 局 (NSA) 宣布 在 犹他 州 布 拉夫 代 尔 镇 新 建 的 情报 体系 综合 国家 网 络 安 全 启动 
数据 中 心 于 2013 年 10 月 落成 。 在 这 个 数据 中 心中 ， ep Fa he es 
面积 用 于 数据 中 心 ， 其 余 90 多 万 平方 英尺 的 面积 用 于 技术 支持 和 管理 。 这 个 新 数据 中 心 将 帮 
助 NSA 监视 因特网 上 巨大 的 数据 传输 业务 。 

据 估 计 ，NSA 大 约 每 小 时 收集 200 万 GB 的 数据 ， 每 天 24 小 时 、 每 周 7 天 不 停工 作 。 所 收 
集 的 数据 包括 国外 和 国内 的 电子 邮件 、 移 动 电话 通话 、 因 特 网 搜索 、 各 种 商品 的 交易 和 其 他 形 
式 的 数字 数据 。 新 数据 中 心 使 用 泰坦 超级 计算 机 (Titan supercomputer) 来 分 析 数 据 ， 这 是 一 种 用 
水 制冷 的 机 器 ， 它 每 秒 可 以 执行 10" 次 指令 运算 。PRISM( 一 种 用 于 资源 集成 、 同 步 和 管理 的 规 
划 工 具 ) 监控 程序 处 理 和 跟踪 所 有 收集 到 的 数据 。 

虽然 我 们 为 个 人 计算 机 和 其 他 设备 购买 存储 器 时 常 以 GB 和 TB 为 单位 ， 但 是 NSA 数据 中 
心 的 存储 容量 需要 以 ZB 为 单位 ( 据 猜测 ，NSA 的 存储 器 容量 将 达到 数 千 ZB, 或 者 达到 YB ) 。 
加 州 大 学 伯克利 分 校 在 2003 年 所 做 的 一 项 研究 中 ， 估 计 了 2002 年 产生 的 新 数据 量 大 约 是 5SEB。 
在 1999 年 年 底 所 做 的 研究 中 ， 估 计 了 人 类 创建 的 各 种 信息 (包括 音频 、 视 频 和 文本 ) 大约 是 
12EB。2006 年 ， 全 世界 所 有 计算 机 硬盘 驱动 器 的 存储 空间 估计 达到 160EB。2009 年 ， 整 个 因 
特 网 估计 包含 大 约 500EB 的 数据 。 美 国 网 络 硬件 制造 商 思 科 ( Cisco ) 公司 估计 2016 年 全 球 因 特 
网 上 的 数据 总 量 将 达到 1.3ZB。 美 国 硬盘 驱动 器 制造 商 希捷 (Seagate) 公司 估计 到 2020 年 总 存 
储 容 量 需 求 将 达到 7ZB。 

NSA 不 是 唯一 一 个 处 理 信息 量 超过 GB 和 TB 的 组 织 。 据 估计 ，Facebook 每 天 收集 500TB 的 
新 资料 ; YouTube 每 4min 观看 大 约 1TB 的 新 视频 信息 ; CERN 大 型 强 子 对 撞 机 每 秒 产生 1PB 的 数 
据 ; 安装 在 新 波音 喷气 发 动机 上 的 传感器 每 小 时 产生 20TB 的 数据 。 虽 然 上 述 例子 不 是 都 要 求 永 





久 存 储 它们 产生 或 处 理 的 所 有 数据 ， 但 是 这 些 例 子 给 我 们 提供 了 每 天 处 理 的 数据 量 。 正 是 由 于 有 
文 么 巨大 的 信息 量 ， 所 以 2011 年 IBM 公司 开发 并 发 布 了 新 的 120PB 硬盘 驱动 器 ， 由 200 000 个 传 
统 硬盘 驱动 器 组 成 的 存储 集群 就 像 一 个 部 件 一 样 协同 工作 。 如 果 把 你 的 MP3 播放 器 插 到 这 个 驱动 
器 上 ， 你 就 能 听 到 大 约 20 亿 小 时 的 音乐 ! 

在 这 个 智能 手机 、 平 板 电脑 、 云 计算 和 其 他 电子 设备 盛行 的 时 代 ， 我 们 将 会 继续 听 到 人 们 
谈论 PB、EB 和 ZB( 在 NSA 那里 甚至 是 YB)。 然 而 ， 如 果 超 过 了 YB 以 后 会 怎样 ? 为 了 努力 跟 
上 信息 的 快速 增长 ， 表 示 更 大 量 的 数据 ， 下 一 ov 
(10”) (对 于 后 者 ， 一 些 建议 使 用 geobyte 和 geopbyte 作为 前 级)。 虽 然 这 些 还 不 是 被 普遍 接受 
的 国际 前 级 单位 ， 但 是 以 史 为 鉴 ， 我 们 不 久 就 会 需要 这 些 前 级 。 


当 GB 的 含义 不 一 样 时 …… 





一 旦 确定 了 磁盘 的 技术 要 求 ( 例 如 ， 磁 盘 传 输 率 、 接 口 类 型 ， 等 等 )， 那 么 购买 新 磁盘 阵 
列 应 该 是 一 个 相对 简单 的 过 程 。 你 可 以 基于 简单 的 价格 容量 比 (比如 美元 /GB ) 做 出 决定 ， 然 后 
就 可 以 购买 了 。 哦 ! 没有 那么 快 。 

第 一 个 障碍 是 必须 清楚 磁盘 驱动 器 所 表示 的 容量 是 格式 化 容量 还 是 非 格 式 化 容量 。 在 格式 
化 过 程 中 差不多 会 消耗 16% 的 磁盘 容量 。( 一 些 商家 称 这 个 数字 为 “可 用 容量 ”。) 自然 ， 当 使 
用 非 格 式 化 容量 时 价格 容量 比 看 起 来 会 更 好 些 ， 虽 然 你 最 感 兴 趣 的 是 磁盘 的 可 用 空间 。 

一 个 障碍 是 ， 要 想 比较 磁盘 容量 的 大 小 就 要 确保 使 用 相同 的 基数 。 磁 盘 给 出 的 容量 是 用 
基数 10 来 计算 的 ， 而 不 是 用 基数 2 来 计算 的 ， 这 种 情况 越 来 越 普 遍 。 因 此 ，1GB 磁盘 驱动 器 
有 10”=1000000000 字 节 ， 而 不 是 2”=1073741 824 字 节 ， 这 大 约 减 少 了 7% 。 当 购买 大 容量 
的 企业 级 存储 系统 时 ， 这 可 能 会 导致 巨大 的 差异 。 

一 个 具体 的 例子 ， 假 设 你 正在 考虑 购买 磁盘 阵列 ， 需 要 从 两 个 主要 制造 商 中 选择 一 
制造 商 X 提供 的 12 x250GB 磁盘 阵列 的 价格 为 20 000 美元 。 制 造 商 Y 提供 的 12 x212.5GB 磁 
盘 阵 列 的 价格 为 21000 美元 。 这 两 种 磁盘 阵列 的 其 他 方面 都 是 相同 的 ， 制 造 商 X 在 成 本 率 上 占 
了 绝对 优势 : 

制造 商 X,， 20 000 美元 + (12 x250GB) 二 6. 67 美元 /GB 
制造 商 Y: 21 000 美元 (12 x212.5GB) 二 8. 24 美元 /GB 

由 于 有 些 怀疑 ， 你 打 了 几 个 电话 ， 了 解 到 制造 商 X 所 说 的 容量 是 用 基数 10 计算 的 非 格式 
化 容量 ， 而 制造 商 立 所 说 的 容量 是 用 基数 2 计算 的 格式 化 容量 。 由 于 不 同 的 制造 商 使 用 完全 不 
同 的 计算 方法 和 表示 方法 ， 所 以 造成 了 这 个 问题 : 制造 商 X 的 磁盘 容量 实际 上 不 是 我 们 通常 认 
为 的 230GB ， 如 果 用 基数 2 计算 ， 它 的 容量 大 约 是 232.8GB。 格 式 化 之 后 ， 容 量 甚 至 减少 到 大 
约 197.9GB。 事 实 上， 真实 的 成 本 率 是 : 

制造 商 义 : 20 000 美元 : (12 x197.9GB) =8.42 美元 /GB 
制造 商 Y: 21 000 美元 (12 x212.5GB) 二 8. 24 美元 /GB 

确实 ， 一 些 供应 商 在 说 明 设 备 容量 时 恪守 诚信 。 不 幸 的 是 ， 一 些 供应 商 仅 在 被 问 到 时 才 会 
说 出 真相 。 作 为 受过 教育 的 专业 人 员 ， 你 的 工作 是 向 供应 商 提出 正确 的 问题 。 


当 我 们 想 表达 快 的 意思 时 ， 用 的 词 是 多 少 分 之 一 秒 ， 一般 有 千 分 之 一 秒 (10“) 、 百 万 分 之 
一 秒 (10“)、 十 亿 分 之 一 秒 (10”) 或 万 亿 分 之 一 秒 (10-”) 等 。 这 些 度量 单位 的 前 级 已 列 在 
表 1-1 中 。 通 常 负 指 数 用 10 的 寡 次 表示 ， 不 用 2 的 寡 次 表示 。 基 于 这 个 原因 ， 新 的 二 进 制 前 
缀 标准 不 包括 任何 负 指 数 的 新 名 称 。 需 要 说 明 的 是 ， 以 分 数 作为 前 缀 的 指数 表示 ， 就 是 表 中 左 
侧 前 缀 的 倒数 。 因 此 ， 如 果 有 人 说 一 个 操作 需要 lms 完成 ， 那么 应 该 理解 为 在 1s 内 会 发 生 100 


奈 ” 注 了 滞 





万 个 这 种 操作 。 当 需要 说 在 1s 内 发 生 多 少 事情 时 ， 应 该 使 用 光 这 样 的 前 绥 。 当 需要 说 这 个 操 
作 执行 有 多 快 时 ， 应 该 使 用 微 这 样 的 前 组 。 

现在 解释 广告 。 广 告 中 的 微 处 理 器 是 一 个 Intel i7 四 核 处 理 器 ， 它 属于 多 核 处 理 器 (在 1. 10 
节 中 有 关于 多 核 处 理 器 的 更 多 信息 ) 。 这 种 处 理 器 运行 的 频率 是 3.9CHz。 每 个 计算 机 系统 包含 
一 个 保持 系统 同步 的 时 钟 。 这 个 时 钟 给 所 有 的 主 部 件 同时 发 送 电子 脉冲 ， 以 确保 数据 和 指令 在 
间 定 的 时 刻 到 达 指 定 的 地 方 。 这 个 时 钟 每 秒 发 出 的 脉冲 数量 就 是 时 钟 频率 。 时 钟 频 率 用 每 秒 周 
期 数 (或 赫兹) 测量 。 如 果 计 算 机 系统 的 时 钟 每 秒 产生 100 万 个 脉冲 ， 那 么 就 说 计算 机 操作 次 数 
在 百 万 赫 效 (MHz) 范围 内 。 现 在 大 多 数 计算 机 每 秒 可 以 产生 10 亿 个 脉冲 ， 即 操作 次 数 在 十 亿 
赫 效 (CHz) 范 围 内 。 因 为 在 计算 机 系统 中 若 没 有 微 处 理 器 的 参与 几乎 什么 事 都 做 不 了 ， 所 以 微 
处 理 器 的 额定 频率 是 整个 系统 速度 的 关键 。 广 告 中 这 个 微 处 理 器 的 时 钟 为 每 秒 39 亿 个 周期 ， 
所 以 销售 者 说 计算 机 以 3.9CHz 运行 。 

不 过 ， 这 个 微 处 理 器 以 3. 9GHz 运行 的 事实 不 一 定 意 味 着 这 个 微 处 理 器 每 秒 能 够 执行 39 亿 
条 指令 ， 也 不 意味 着 执行 每 条 指令 需要 0. 039ns。 稍 后 你 将 会 看 到 执行 每 个 计算 机 指令 需要 固 
定 的 周期 数 。 一 些 指令 需要 1 个 周期 ， 而 绝 大 多 数 指令 需要 多 个 周期 。 一 个 微 处 理 器 每 秒 能 够 
执行 的 指令 数 与 它 的 时 钟 速度 成 比例 关系 。 执 行 一 条 特定 的 机 器 指令 所 需要 的 时 钟 周期 数 取 决 
于 这 个 机 器 的 组 织 和 体系 结构 。 

接 下 来 要 看 的 是 广告 中 的 “1600MHz 32GB DDR3 SDRAM”。 这 里 1600MHz 是 指 系统 总 线 
的 速度 ， 总 线 是 传输 数据 和 指令 到 计算 机 内 各 个 地 方 的 一 组 线 。 总 线 速度 也 是 用 MHz 或 者 
GHz 表示 的 。 许 多 计算 机 有 一 个 特别 的 局 部 总 线 用 于 支持 非常 快速 的 数据 传输 ( 如 速度 要 求 很 
高 的 视频 传输 ) 。 这 个 局 部 总 线 是 存储 器 直接 连接 到 处 理 器 的 高 速 通路 。 总 线 速度 基本 上 设 定 
了 系统 的 信息 传输 能 力 的 上 限 。 

在 广告 中 系统 有 一 个 容量 为 32GB 的 存储 器 ， 它 大 约 能 存储 320 亿 字 符 。 存 储 器 容量 不 仅 
仅 决 定 能 运行 的 程序 大 小 ， 而 且 也 决定 在 不 使 系统 陷 人 停滞 状态 能 同时 运行 多 少 个 程序 。 你 的 
应 用 或 者 操作 系统 制造 者 通常 会 建议 运行 其 产品 需要 多 大 的 存储 器 。( 有 时 这 些 建 议 非 常 保 守 ， 
所 以 要 当心 你 相信 的 人 !) 

除了 存储 右 大 小 之 外 ， 广 告 中 还 提供 了 一 种 存储 器 类 型 SDRAM， 这 是 同步 动态 随机 存 取 
存储 器 的 英文 缩写 。SDRAM 比 传统 ( 非 同步 ) 存储 器 更 快 ， 因 为 它 能 使 自己 与 微 处 理 器 的 总 线 
同步 。 在 广告 中 系统 配置 的 是 DDR3 SDRAM， 它 的 意思 是 第 3 类 双 们 数据 速率 同步 动态 随机 
存 取 存储 器 (有 关 不 同类 型 存储 器 的 更 多 信息 ， 见 第 6 章 ) 。 


你 有 没有 想 过 计算 机 里 面 是 什么 样子 的 呢 ? 在 本 节 介 绍 的 计算 机 例子 中 给 出 了 一 个 现代 计 
算 机 部 件 的 很 好 介绍 。 然 而 ， 即 使 你 熟悉 这 些 部 件 和 它们 的 功能 ， 打 开 计 算 机 并 试图 找到 和 识 
别 各 种 部 件 也 不 容易 。 

打开 计算 机 的 盖子 ， 你 肯定 会 首先 注意 到 一 个 带 有 风扇 的 大 金属 盒子 ， 这 是 给 计算 机 供电 
的 电源 。 你 也 会 看 到 各 种 驱动 器 ,包括 一 个 硬盘 驱动 器 和 一 个 DVD 驱动 器 (或 许 是 老式 的 软盘 
驱动 器 或 CD 驱动 器 ) 。 计 算 机 内 有 许多 集成 电路 ， 就 是 那些 小 的 、 黑 色 的 、 带 “ 腿 " 的 长 方形 
盒子 。 你 也 会 注意 到 系统 中 电 的 通路 或 总 线 。 计 算 机 内 有 揪 在 主板 插 构 中 的 印 制 电路 板 (扩展 
卡 ) ， 主 板 是 放 在 标准 台式 机 底部 的 大 电路 板 ， 如 果 是 塔 式 计算 机 或 小 塔 式 计算 机 ， 则 主板 是 
放 在 侧面 的 大 电路 板 。 主 板 连接 计算 机 中 的 所 有 部 件 ， 包 括 CPU、RAM 和 ROM， 以 及 各 种 其 
他 基本 部 件 。 主 板 上 的 这 些 部 件 往往 是 最 难 识别 的 。 下 面 的 Acer E360 主板 带 有 比较 权威 的 部 
件 标记 。 


绪 论 和 
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连接 器 (X2 ) 


CMOS 后 备 电池 
24 针 ATX 


电源 连接 器 集成 图 形 处 理 器 
( 带 散热 器 ) 
超级 IO 芯片 


DIMM 存 储 器 PCI 揪 槽 ( X3 ) 


插 槽 ( X4 ) 
CPU 风扇 

连接 器 
集成 音频 


CPU 风 局 编 解码 器 芯片 
和 散热 器 集成 千 兆 级 
以 太 网 芯片 
CPU 插 槽 PCI Express 插 槽 
( 播 档 939 ) 用 于 集成 外 设 的 连接 器 


PS/2 键 盘 和 鼠标 、 串 口 、 
USB CX4) 记 入 网、 首 硕 《3 ) 
来 源 : 英文 维基 百科 的 Moxfyre( http :commons. wikimedia. org/ wiki/ File: Acer_E360_Socket_939_motherboard_by_ 
Foxconn. svg) 

南 桥 是 一 种 控制 硬盘 和 输入 /输出 的 集成 电路 (包括 音频 和 视频 卡 )， 它 是 一 个 把 低速 WO 
设备 连接 到 系统 总 线 的 集线器 。 这 些 设备 通过 I/O 端口 连接 到 板子 底部 。PCI 插 模 能 够 插 各 种 
PCI 设备 的 扩展 板 。 这 个 主板 也 有 PS/2 和 火线 连接 器 。 它 有 串口 和 并 口 ， 还 有 4 个 USB 端口 
这 个 主板 有 2 个 IDE 连接 器 插 模 、4 个 SATA 连接 器 插 模 核 1 个 软盘 控制 器 。 超 级 LO 芯片 是 
控制 软盘 、 串 并 口 、 键 盘 和 鼠标 等 设备 的 [LO 控制 器 。 这 个 主板 还 有 1 个 集成 的 音频 芯片 、1 
0 ~、 RAM 存储 体 。 主 板 上 没有 插 处 理 器 ， 但 是 

可 以 看 到 插 CPU 的 插 楼 所 有 计算 机 都 有 内 部 电池 ， 在 照片 顶部 中 间 可 以 看 到 它 这 个 供电 
on 当 第 一 次 上 电 时 ，BIOS 闪存 芯片 保存 着 计算 机 ROM 中 所 使 用 的 
指令 

看 机 箱 内 部 时 一 定 要 注意 : 打开 机 箱 盖 会 有 许多 与 你 和 计算 机 相关 的 安全 问题 。 你 要 做 好 
以 下 事情 以 使 风险 最 小 化 : 首先 也 是 最 重要 的 ， 确 保 计 算 机 已 关机 。 通 常 要 先 拔 下 电源 插头 ， 
因为 电源 线 为 静电 提供 了 通路 。 在 打开 计算 机 机 箱 和 触 碰 任何 内 部 器 件 之 前 ， 你 要 确保 已 正确 
接地 ， 这 样 静电 就 不 会 损坏 任何 部 件 。 机 箱 盖 的 边缘 和 电路 板 的 边缘 等 处 可 能 是 锋利 的 ， 所 以 
拿 这 些 东 西 时 要 当心 。 试 图 把 没有 对 准 的 卡 插入 插 模 可 能 会 损坏 卡 和 主板 ， 所 以 在 插 卡 和 拨 卡 
时 都 要 小 心 


这 个 广告 的 下 一 行 “128KB Ll 高 速 缓存 ，2MB 12 高 速 缓存 ”说 的 也 是 一 种 存储 器 。 在 第 
6 章 中 ， 你 将 会 学 习 无 论 总 线 的 传输 速度 多 快 ， 从 存储 器 传送 数据 到 处 理 器 仍然 要 用 “一 段 时 
间 ”。 为 了 更 快 地 存 取 数 据 ， 许 多 系统 都 有 一 个 叫 作 高 速 缓冲 存储 器 (cache ) 的 特殊 存储 器 。| 
告 中 的 系统 有 两 种 高 速 缓冲 存 储 顺 。 第 一 级 高 速 缓冲 存储 需 (L1 ) 是 一 个 小 的 、 快 速 的 、 放 在 
微 处 理 器 已 片 内 部 的 高 速 缓冲 存储 器 ， 作用 是 提高 常用 数据 的 存 取 速 度 。 第 二 级 高 速 缓冲 存储 
器 (L2 ) 是 一 种 放 在 存储 需 忌 片 中 的 快速 存储 天 ， 位 于 微 处 理 器 和 主 和 存储器 之 间 请 注意 ,在 
我 们 的 系统 中 高 速 缓冲 存储 器 的 容 弃 量 是 数 千 字 节 (KB) ， 这 和 主 存储 器 相 比 容量 很 小 。 在 第 6 
章 中 ， 你 将 学 到 高 速 缓冲 存储 器 的 工作 原理 ， 并 且 可 以 了 解 到 容量 更 大 的 高 速 缓冲 存储 器 其 效 
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果 并 不 一 定 更 好 。 

另 一 方面 ， 大 家 公认 的 是 固定 磁盘 的 容量 越 大 ， 计算机 的 运行 状况 越 好 。 广 告 中 的 系统 
有 1TB 的 硬盘 ， 这 是 现在 的 平均 标准 。 然 而 ， 固 定 磁 盘 或 硬盘 存储 器 的 容量 并 不 是 唯一 要 
考虑 的 事情 。 如 果 磁 盘 运 行 太 慢 ， 容 量 大 也 不 会 对 主机 系统 有 特别 大 的 帮助 。 广 告 中 的 计 
算 机 有 一 个 转速 为 7200r/min 的 硬盘 。 对 于 有 相关 知识 的 读者 来 说 ， 这 就 表明 它 是 一 个 相当 
快 的 驱动 器 。 通 常 ， 磁 盘 速 度 用 在 磁盘 上 存 取 数据 所 需要 的 平均 毫秒 数 来 表示 ， 而 不 用 磁 
盘 转速 来 表示 。 

转速 仅仅 是 磁盘 整体 性 能 的 决定 因素 之 一 。 磁 盘 连 接 到 系统 其 他 部 件 的 方式 或 接口 也 是 很 
重要 的 。 广 告 中 的 系统 使 用 SATAI( 串 行 高 级 技术 附件 ， 或 串 行 ATA) 磁盘 接口 。 这 是 一 个 改进 
的 替代 IDE 或 电子 集成 驱动 器 的 存储 接口 。 另 一 个 常见 的 接口 是 EIDE (增强 电子 集成 驱动 
器 ) ， 对 于 大 容量 存储 设备 来 说 它 是 一 种 划算 的 硬件 接口 选择 。EIDE 含有 人 允许 增强 计算 机 连接 
性 、 速 度 和 存储 容量 的 特殊 电路 。 绝 大 多 数 ATA、IDE 和 EIDE 系统 与 处 理 器 和 存储 器 共享 主 
系统 总 线 ， 所 以 磁盘 之 间 的 数据 传送 也 依赖 于 系统 总 线 的 速度 。 

系统 总 线 可 以 响应 计算 机 内 部 的 所 有 数据 传送 ， 端 口 允许 设备 外 部 和 计算 机 之 间 进 行 数据 
传输 。 广 告 中 提 到 了 两 种 不 同 的 端口 一 一 “10 个 USB 端口 ，1 个 串 行 口 "。 串 行 端口 在 传输 数 
据 时 用 一 根 或 两 根 数据 线 发 送 一 连 串 电 脉冲 。 在 有 些 计算 机 上 还 有 另外 一 种 端口 一 一 并 行 端 
口 。 并 行 端口 使 用 至 少 8 根 数据 线 同 时 传送 数据 。 许 多 新 的 计算 机 只 带 有 USB 端口 ， 不 再 有 串 
行 或 并 行 端口 。USB( 通用 串 行 总 线 ) 是 一 个 流行 的 外 部 总 线 ， 支 持 即 插 即 用 安装 ( 自动 配置 设 
备 的 能 力 ) 以 及 热 插 拔 (在 计算 机 运行 状态 下 添加 和 去 掉 设 备 的 能 力 ) 。 

扩展 构 是 主板 上 的 开口 ， 给 计算 机 增加 新 功能 的 各 种 扩展 板 可 以 插 到 扩展 槽 中 。 这 些 捅 村 
用 于 增加 存储 器 、 视 频 卡 、 声 卡 、 网 卡 和 调制 解 调 器 等 。 一 些 系统 把 专用 IO 总 线 插 在 扩展 槽 
中 以 增强 主 总 线 的 能 力 。 外 围 部 件 互 连 ( PIC) 是 一 种 支持 多 个 外 围 设备 连接 的 VO 总 线 标 准 。 
由 Intel 公司 开发 的 PCI 操作 速度 快 而 且 支 持 即 插 即 用 。 

PCI 是 一 种 比较 老 的 标准 (在 1993 年 前 后 颁布 的 ) ，2004 年 它 被 PCI-x 取代 。PCI-x 基本 上 
是 常规 PCI 带宽 的 两 倍 。PCI 和 PCI-x 都 是 并 行 操作 。2004 年 ，PCIe 替代 PCI-x。PCIe 以 串 行 
方式 进行 操作 ， 是 当今 计算 机 的 标准 。 在 这 个 广告 中 ， 我们 看 到 这 个 计算 机 有 1 个 PCI 插 槽 、 
1 个 PCI x 16 插 槽 和 2 个 PCI x1 插 槽 。( 译 者 注 : PCI x 16 的 准确 写法 应 该 是 PCIe x 16; PCI x 
1 的 准确 写法 应 该 是 PCIe x 1。) 这 个 计算 机 也 有 蓝牙 (一 种 允许 短 距 离 信息 传输 的 无 线 技术 ) 和 
HDMI 端口 (用 于 传输 音频 和 视频 的 高 清晰 多 媒体 接口 ) 。 

PCIe 不 仅 蔡 代 了 PCI 和 PCI-x， 而 且 在 图 形 领域 已 经 逐步 取代 了 由 Intel 特别 为 3D 图 形 设 
计 的 AGP( 加 速 图 形 接口 ) 。 广 告 中 的 计算 机 有 1 个 带 有 1GB 存储 器 的 PCIe 视频 卡 。 卡 上 的 一 
种 特殊 图 形 处 理 单 元 会 使 用 这 个 存储 器 。 图 形 处 理 单元 负责 为 图 形 执行 必要 的 计算 ， 所 以 计算 
机 的 主 处 理 器 就 不 再 需要 做 这 些 工作 了 。 这 个 计算 机 也 有 1 个 PCIe 声卡 ， 声 卡 由 系统 的 立体 
声 扬声器 和 传声器 所 需要 的 部 件 构成 。 

在 这 个 广告 中 除了 告诉 我 们 端口 和 扩展 覃 之 外 ， 还 给 我 们 提供 了 一 个 LCD (液晶 显示 ) 的 
信息 。 显 示 器 对 计算 机 系统 的 速度 或 效率 几乎 没有 任何 影响 ， 但 是 与 使 用 者 的 舒适 感 有 很 大 的 
关系 。LCD 显示 器 的 规格 如 下 : 24in、1920 x 1200 WUXGA、300cd/m*、 有 源 和 矩阵 、1000.: 1 
(静态 ) 、8ms、24 位 彩色 (1670 万 种 颜色 ) 、VGAZDVI 输 入 和 2 个 USB 端口 。LCD 是 使 用 液晶 
材料 夹 在 两 片 偏振 玻璃 中 间 形 成 的 。 电 流 引 起 液晶 旋转 移动 ， 从 而 允许 不 同 程度 的 背光 通过 ， 
使 文本 、 颜 色 和 图 片 出 现在 屏幕 上 。 这 是 由 打开 或 关闭 不 同 的 像素 来 实现 的 ， 像 素 是 小 的 “图 
片 元 素 ” 或 屏幕 上 的 点 。 显 示 器 通常 有 数 百 万 个 按照 行 和 列 排列 的 像素 。 这 个 显示 器 有 1920 x 
1200( 超 过 100 万 ) 个 像素 。 





当今 制造 的 绝 大 多 数 LCD 利用 主动 矩阵 技术 ， 而 被 动 矩阵 技术 只 用 在 较 小 的 设备 上 ， 如 
计算 器 和 时 钟 等 。 主 动 矩阵 技术 对 于 每 个 像素 使 用 一 个 晶体 管 ; 被 动 矩阵 技术 用 品 体 管 激活 整 
行 和 整 列 像素 。 虽 然 被 动 技术 成 本 较 低 ， 但 是 主动 技术 呈现 的 图 像 更 好 ， 因 为 主动 技术 能 独立 
地 驱动 每 个 像素 。 

广告 中 的 LCD 显示 带 是 24in 的 ， 即 测量 LCD 显示 器 对 角 线 得 到 的 太 寸 。 这 种 测量 影响 显 
示 器 的 宽 高 比 ， 即 显示 器 能 够 显示 的 水 平 像素 与 垂直 像素 的 比值 。 传 统 显示 器 的 宽 高 比 是 4:3， 
但 是 较 新 的 宽屏 显示 需 使 用 16:10 或 16:9 的 比值 。 超 宽 显 示 顺 使 用 更 高 的 宽 高 比 ， 大 约 3:1 或 
Dds 

当 讨 论 分 辩 率 和 LCD 时 ,一 定 要 注意 LCD 有 原生 分 辩 率 ， 这 意味 着 LCD 是 为 一 个 特定 分 
辩 率 而 设计 的 (通常 用 水 平 像素 乘 以 垂直 像素 给 出 ) 。 虽 然 你 能 改变 分 辩 率 ， 但 是 图 像 质 量 通 
常 也 会 受 影响 。 分 辩 率 和 宽 高 比 通常 是 配对 的 。 当 给 出 LCD 的 分 辨 率 时 ， 制 造 商 经 常 使 用 下 
列 缩写 : XGA( 扩 展 图 形 阵列 ) 、XGA + (扩展 图 形 阵 列 + )、SXGA (高 级 XGA)、UXGA( 极 速 
XGA)、W 前 级 ( 宽 ) 、WVA( 宽 视角 )。 视 角 是 用 度 表示 的 角度 ， 在 这 个 角度 内 使 用 者 能 够 看 
到 屏幕 上 的 图 像 ， 一 般 的 视角 范围 为 120° ~ 170"。 标 准 4:3 原生 分 辩 率 的 例子 包括 : XGA 
(1024 x768)、SXGA(1280 x1024)、SXGA + (1400 x1050) 和 UXGA(1600 x 1200 ) 。 一 般 16:9 
和 16:10 分 辨 率 包括 : WXGA(1280 x800)、WXGA + (1440 x900) 、WSXGA + (1680 x 1050 ) 和 
WUXGA( 1920 x1200 ) 。 

LCD 显示 器 的 规格 说 明 书 通常 会 列 出 响应 时 间 ， 它 是 指 像素 变换 颜色 的 速率 。 如 果 这 个 速 
率 太 慢 ， 就 会 出 现 重 影 和 模糊 。 广 告 中 LCD 显示 器 的 响应 时 间 是 8ms。 开 始 时 响应 速率 是 用 像 
素 从 黑色 变 成 白色 再 变 回 黑色 所 需要 的 时 间 来 测量 的 。 现 在 许多 厂商 列 出 的 响应 时 间 是 灰 阶 到 
灰 阶 的 转换 时 间 ( 这 个 时 间 一 般 会 更 快 ) 。 比 较 显 示 器 是 件 非常 困难 的 事 ， 因 为 厂商 一 般 不 会 
说 明 测量 的 是 什么 颜色 的 转换 时 间 。 一 个 厂商 说 其 显示 需 的 响应 时 间 是 2ms( 测 量 的 是 灰 阶 到 
灰 阶 的 转换 时 间 ) ， 而 另 一 个 三 商 可 能 说 其 显示 融 的 响应 时 间 是 Sms( 测 量 的 是 黑色 到 白色 再 到 
黑色 的 转换 时 间 ) 。 现 实 中 ， 响 应 时 间 为 Sms 的 显示 器 可 能 更 快 。 

继续 看 这 个 广告 ， 我 们 看 到 LCD 显示 器 有 一 个 参数 说 明 是 300cd/m ,这 是 显示 器 的 发 光 
度 。 发 光度 (或 图 像 亮度 ) 是 对 LCD 显示 器 发 出 光 的 量 的 测量 ,一般 用 每 平方 米 坎 德 拉 ( cd/m ) 
表示 。 当 购买 显示 器 时 ， 亮度 等 级 应 该 至 少 达 到 250( 越 高 越 好 ) ， 计 算 机 显示 器 的 平均 亮度 是 
200 ~300cd/m 。 发 光度 会 影响 阅读 的 难 易 程 度 ， 特 别 是 在 光线 较 暗 的 情况 下 。 

发 光度 测量 亮度 ， 对 比 度 测量 在 亮 白 和 暗黑 之 间 的 强度 差 值 。 对比度 可 能 是 静态 的 (在 显 
示 器 上 ， 在 一 个 给 定 的 时 刻 最 亮点 与 最 暗 点 的 比值 ) 或 动态 的 (在 不 同时 间 点 ， 一 个 图 像 中 最 
暗 点 与 男 一 个 图 像 中 最 亮点 的 比值 )。 一 般 情况 下 首选 静态 参数 。 低 静态 对 比 度 ( 比如 300:1) 
使 辨别 深浅 更 困难 ; 好 的 静态 对 比 度 是 500:1( 范围 为 400:1 ~3000:1)。 广 告 中 显示 器 的 静态 对 
比 度 是 1000:1。LCD 显示 器 可 能 有 动态 对 比 度 12 000 000:1 及 更 高 ， 但 是 具有 较 高 动态 对 比 度 
的 显示 天 并 不 一 定 意味 着 比 具 有 较 低 静态 对 比 度 的 显示 器 更 好 。 

在 广告 中 对 LCD 显示 器 给 出 的 下 一 个 参数 是 色彩 深度 。 这 个 数值 反映 的 是 在 屏幕 上 可 以 
同时 显示 的 色彩 数量 。 一 般 深度 是 8 位 、16 位 、24 位 和 32 位 。 广 告 中 的 LCD 显示 器 能 显示 
2” 种 颜色 。 

LCD 显示 器 也 有 许多 可 选 的 特点 。 一 些 有 集成 的 USB 端口 (就 像 广告 中 的 一 样 ) ， 一 些 可 能 
有 扬声器 。 许 多 都 与 HDCP( 高 带宽 数字 内 容 保护 ) 兼 容 (这 意味 着 你 可 以 观看 HDCP 加 密 的 影视 
资料 ， 比 如 蓝光 光盘 ) 。LCD 显示 器 可 能 也 提供 VGA( 视频 图 形 阵 列 ) 和 DVI( 数 字 视 频 接 口 ) 连 
接 。 因 为 VGA 给 显示 器 发 送 的 是 模拟 信号 ， 所 以 需要 进行 数 - 模 转 换 ; DVI 已 经 是 数字 格式 了 ， 
所 以 不 需要 转换 ， 它 可 以 获得 更 干净 的 信号 和 更 清晰 的 图 像 。 虽 然 LCD 显示 器 使 用 DVI 连接 通常 
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会 有 更 好 的 图 像 ， 但 是 用 现 有 的 系统 部 件 的 两 种 连接 器 也 可 以 连 到 LCD 显示 器 上 。 

既然 我 们 已 经 讨论 了 LCD 显示 器 是 如 何 工作 的 ， 也 明白 了 像素 概念 ， 那么 就 返回 再 更 详 
细 地 讨论 图 形 卡 ( 也 叫 视 频 卡 ) 。 在 屏幕 上 有 数 百 万 像素 ,决定 哪 个 像素 关 哪 个 像素 开 ( 并且 显 
示 什 么 颜色 ) 是 相当 具有 挑战 性 的 。 图 形 卡 的 工作 是 从 计算 机 上 输入 二 进 制 数据 ， 再 转换 为 控 
制 显示 器 上 所 有 像素 的 信号 ， 因 此 图 形 卡 在 处 理 器 和 显示 器 之 间 起 “中 间 人 ”的 作用 。 就 像 
以 前 提 到 的 ， 一 些 计 算 机 已 经 集成 了 图 形 卡 ， 这 意味 着 计算 机 的 处 理 器 负责 图 形 的 控制 信号 的 
转换 工作 ， 在 处 理 器 上 会 有 大 量 负 载 ， 因 此 很 多 计算 机 都 有 图 形 卡 插 槽 ， 人 允许 图 形 卡 上 的 处 理 
器 ( 称 为 图 形 处 理 单 元 ， 或 GPU ) 处 理 转换 工作 。 

CPU 不 是 普通 的 处 理 器 。 它 被 设计 成 最 有 效 处 理 绘制 图 像 所 需要 的 复杂 计算 ， 并 且 带 有 特 
殊 的 程序 使 它 能 够 更 有 效 地 执行 这 类 任务 。 图 形 卡 通常 带 有 自己 专用 的 RAM， 它 用 于 保存 临 
时 结果 和 信息 ， 包 括 屏幕 上 每 个 像素 的 位 置 和 颜色 等 。 帧 缓冲 区 (这 是 RAM 的 一 部 分 ) 用 于 存 
储 所 绘制 的 图 像 直 到 这 些 图 像 被 显示 。 图 形 卡 上 的 存储 器 连接 到 数 - 模 转 换 器 (DAC) ， 数 - 模 
转换 器 把 二 值 图 像 转换 为 显示 器 可 以 理解 的 并 且 可 以 通过 电缆 发 送 到 显示 器 的 模拟 信号 。 现 在 
绝 大 多 数 图 形 卡 都 有 两 类 显示 器 连接 : 用 于 LCD 屏幕 的 DVI 和 用 于 老式 CRT( 阴极 射线 管 ) 屏 
幕 的 VGA。 

绝 大 多 数 图 形 卡 都 插 在 计算 机 主板 的 插 槽 中 ， 所 以 由 计算 机 供电 。 然 而 ， 有 些 图 形 卡 功率 
很 大 ， 因 此 实际 上 需要 直接 连接 到 计算 机 的 电源 上 。 这 些 高 端 图 形 卡 通常 可 以 在 处 理 图 像 密集 
应 用 (如 视频 编辑 和 高 端 游戏 ) 的 计算 机 中 找到 。 

继续 这 个 广告 ,我 们 看 到 这 个 系统 有 一 个 16 x CD/DVD +/ -RW 驱动 器 。 这 就 是 说 我 们 可 
以 对 DVD 和 CD 进行 读 和 写 。“16 x ”是 驱动 器 速度 的 度量 ， 它 度量 的 是 驱动 器 能 够 以 多 快 的 
速度 读 和 写 。DVD 和 CD 在 第 7 章 中 有 更 详细 的 讨论 。 

如 果 计 算 机 能 够 与 外 界 通信 ， 那 么 它们 就 会 更 有 用 。 一 种 通信 方式 是 使 用 因特网 服务 提供 商 
和 调制 解 调 器 。 在 广告 中 没有 提 到 这 个 计算 机 有 调制 解 调 器 ， 许 多 台式 计算 机 的 机 主 使 用 由 因 特 
网 服务 提供 商 提供 的 外 接 调 制 解 调 器 (电话 调制 解 调 器 、 有 线 电视 调制 解 调 器 、 卫 星 调 制 解 调 器 
等 ) 。 无 论 如 何 ，USB 和 PCI 调制解调器 都 可 以 使 计算 机 通过 电话 线 连接 到 因特网 ， 许 多 连接 到 
因特网 上 的 计算 机 也 可 以 当 作 一 台 传真 机 来 使 用 。 在 第 7 章 会 全 面 地 讨论 IO 和 IO 总 线 。 

计算 机 也 能 直接 连接 到 网 络 上 。 网 络 允 许 计算 机 共享 文件 和 外 围 设 备 。 计 算 机 能 通过 有 线 或 
无 线 技 术 连 接 到 一 个 网 络 。 有 线 计 算 机 使 用 以 太 网 技术 ， 它 是 一 种 有 线 网 络 的 国际 标准 网 络 技 
术 ， 有 两 个 连接 选择 。 第 一 个 是 使 用 经 PCI 搬 覃 连接 到 主板 上 的 网 络 接口 卡 (NIC) 。NIC 一 般 支 
持 10/100 以 太 网 (以 太 网 的 网 速 是 10Mbit/s， 快速 以 太 网 的 网 速 是 100Mbitys ) 或 10X100X1000 以 
太 网 (这 是 增加 了 网 速 1000Mbit/s 的 以 太 网 ) 。 另 一 个 选择 是 使 用 集成 的 以 太 网 ， 即 主板 自身 包含 
所 有 必 备 的 部 件 以 支持 10/100 以 太 网 ， 所 以 不 需要 PCI 捅 槽 。 无 线 网 络 同 样 有 两 个 连接 选择 。 
无 线 NIC 可 以 从 许多 的 供应 商 那里 买 到 ， 台 式 计算 机 和 笔记 本 电脑 都 可 以 使 用 。 为 了 在 台式 计 
算 机 上 安装 它 ， 你 需要 一 个 内 部 卡 ， 卡 上 极 有 可 能 有 一 个 小 天 线 。 通 常 笔记 本 电脑 的 无 线 网 卡 
要 使 用 一 个 扩展 (PCMCIA) 覃 ， 并 且 供 应 商 已 经 开始 把 天 线 集成 到 屏幕 后 面 的 盒子 背面 了 。 集 
成 无 线 ( 就 像 在 Intel 迅驰 无 线 技术 中 看 到 的 ) 消除 了 网 线 和 网 卡 的 有 麻烦。 广告 中 的 系统 使 用 的 
是 集成 以 太 网 。 注 意 ,许多 新 的 计算 机 除了 集成 以 太 网 处 ， 可 能 还 有 集成 图 形 和 和 集成 声音 。 

虽然 我 们 不 能 深入 研究 所 有 具体 品牌 的 各 种 部 件 ， 但 在 学 习 以 上 内 容 后 ， 你 应 该 能 理解 绝 大 
多 数 计算 机 系统 操作 的 概念 了 。 这 对 于 普通 的 使 用 者 以 及 有 经 验 的 程序 员 都 很 重要 。 作 为 一 个 使 
用 者 ， 你 需要 了 解 计算 机 系统 的 优势 和 局 限 ， 以 便 能 够 做 出 明智 的 应 用 决策 ， 更 有 效 地 使 用 你 的 
系统 。 作 为 一 个 程序 员 ， 你 需要 确切 地 理解 系统 硬件 的 功能 ， 以 便 写 出 有 效 和 高 效 的 程序 。 例 如 ， 
像 使 用 映射 主 存 到 高 速 缓冲 存储 器 的 硬件 算法 这 样 的 简单 事情 ， 以 及 把 这 种 方法 用 在 交叉 存 取 存 储 





右上 ， 对 你 确定 是 以 行 主 序 方式 还 是 以 列 主 序 方式 访问 矩阵 元 素 有 巨大 的 影响 。 

在 本 书 中 我 们 考察 了 大 型 和 小 型 计算 机 。 大 型 计算 机 包括 大 型 机 、 企 业 级 服务 器 和 超级 计 
算 机 。 小 型 计算 机 包括 个 人 系统 、 工 作 站 和 手持 设备 。 我 们 将 展示 无 论 从 事 日 常 工作 ， 还 是 执 
行 复杂 的 科学 任务 ， 这 些 系统 的 部 件 都 非常 相似 。 除 了 关注 什么 是 现在 的 主流 计算 之 外 ,我 们 
也 会 看 一 些 系统 架构 。 和 希望 你 从 本 书 中 获得 的 知识 帮助 你 继续 深入 研究 计算 机 组 成 和 体系 结构 
领域 


平板 电脑 


数字 设备 公司 的 创始 人 肯 ' 奥 尔 森 曾 说 :“ 对 任何 个 人 来 说 在 家 里 放 一 台 计 算 机 是 不 需要 
理由 的 。” 他 因此 受到 不 公正 的 嘲笑 。 他 是 在 1977 年 说 这 和 句 话 的 ， 当 时 一 说 到 计算 机 这 个 词 ， 
想到 的 就 是 他 的 公司 制造 的 那 种 机 器 : 像 冰箱 那么 大 的 庞然大物 ， 要 花 一 大 笔 钱 购买 而 且 需 要 
高 技能 的 人 来 操作 。 毫 不 夸张 地 说 ,或 许 除 了 计算 机 工程 师 之 外 ,没有 人 曾经 在 家 里 放 过 这 样 
一 台 计 算 机 。 

正如 已 经 讨论 过 的 ,“ 个 人 计算 ”势头 开始 于 20 世纪 80 年 代 ， 爆 发 于 万 维 网 建立 的 20 世 
纪 90 年 代 。 到 2010 年 ， 每 十 年 进行 一 次 的 人 口 财产 调查 数据 显示 ，68% 的 美国 家 庭 都 声称 有 
一 台 个 人 计算 机 。 然 而 ， 有 证 据 表 明 这 种 趋势 已 经 达到 高 峰 ， 现 在 是 下 降 期 ， 主 要 原因 是 智能 
手机 和 平板 电脑 的 广泛 使 用 。 据 估计 ， 美 国 65% 的 因特网 用 户 只 通过 移动 平台 来 连接 。 这 种 
趋势 的 关键 是 增强 这 些 设备 的 可 用 性 。 

对 于 浏览 网 页 、 阅 读 邮 件 或 听 音 乐 ， 我 们 几乎 不 需要 台式 计算 机 的 性 能 。 装 在 一 个 易于 使 
用 的 包 中 的 平板 电脑 提供 给 我 们 的 恰恰 是 我 们 所 需要 的 ， 平 板 电脑 更 经 济 、 更 轻 。 平 板 电脑 像 
书 一 样 的 外 观 诱 导 人 们 认为 平板 电脑 就 是 完美 的 “便携 式 计 算 机 ”。 

这 里 有 一 个 拆 开 的 Pandigital Novel 平板 电脑 的 照片 。 我 们 标注 了 常见 于 平板 电脑 的 各 种 部 
件 。 迷 你 USB 端口 提供 了 对 内 部 存储 器 和 可 拆 纯 SD 卡 的 访问 。 几 乎 所 有 的 平板 电脑 都 提供 连 
接 因 特 网 的 Wi-Fi， 一 些 平板 电脑 也 支持 2G、3G 和 4G 蜂窝 电话 协议 。 对 于 绝 大 多 数 高 效 的 高 
端 平板 电脑 来 说 ， 电 池 续 航 能 力 能 够 达到 14h。 不 像 这 个 Pandigital 平板 电脑 ， 绝 大 多 数 平板 电 
脑 至 少 有 一 个 用 来 拍摄 静止 照片 和 活动 视频 的 摄像 头 


迷你 USB 端 口 


可 拆卸 SD 揪 本 ”一 复位 和 电源 开关 
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边框 周围 的 Wp 
防护 玻璃 rar 
的 耳机 插入 


一 个 拆 开 的 平板 电脑 
来 源 : 由 Julia Lobur 提供 
触摸 屏 在 所 有 便携 式 设备 中 占有 绝对 优势 。 对 于 消费 类 的 平板 电脑 和 电话 而 言 ， 触 摸 屏 有 两 
种 类 型 : 电阻 式 和 电容 式 。 电 阻 式 触摸 屏 响 应 一 个 手指 或 手写 笔 的 压力 。 电 容 式 触摸 屏 对 人 皮肤 
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的 电 特 性 做 出 反应 。 电 阻 式 屏 幕 不 如 电容 式 屏幕 敏感 ， 但 是 电阻 式 屏幕 可 以 提供 更 高 的 分 辩 率 。 
不 像 电 阻 式 屏幕 ， 电 容 式 屏 幕 支 持 多 点 触摸 ， 这 是 检测 两 个 或 多 个 手指 同时 按 下 的 能 力 。 

军事 和 医疗 计算 机 的 触摸 屏 要 比 用 于 消费 市 场 的 触摸 屏 更 加 耐用 。 表 面 声 波 触感 和 红外 线 
触感 两 种 不 同 的 技术 分 别 发 送 超 声波 和 红外 线 波 以 穿 过 加 固 的 触摸 屏 表 面 。 当 一 个 手指 接触 到 
屏幕 表面 时 ， 波 的 阵列 会 被 破坏 。 

由 于 高 效 ， 移 动 电话 CPU 技术 已 经 被 改变 以 适应 平板 电脑 的 平台 。 虽 然 Intel 和 AMD 一 直 
在 扩大 市 场 份 额 ， 但 移动 计算 领域 已 经 被 ARM 芯片 所 控制 。 这 些 设备 所 使 用 的 操作 系统 包括 
谷歌 公司 的 Android 的 变种 和 苹果 公司 的 i0S。 微 软 公司 的 Surface 平板 电脑 运行 Windows 8 ， 提 
供 对 微软 Office 软件 产品 套件 的 访问 。 

正如 平板 电脑 不 断代 替 台 式 机 一 样 ， 它 们 也 将 在 那些 传统 计算 机 甚至 笔记 本 电脑 等 不 适合 
的 领域 中 找到 用 武之 地 。 所 有 平台 都 可 以 获得 数 以 千 计 的 免费 和 便宜 的 应 用 ， 因 此 需求 进一步 
增加 。 教 育 应 用 数不胜数 。 平 板 电 脑 的 大 小 、 形 状 、 质 量 与 平装 书 类 似 ， 在 美国 一 些 学 区 中 ， 
平板 电脑 正在 取代 纸 质 教材 。 因 此 ， 难 以 实现 的 “每 个 学 生 一 台 计 算 机 ”的 梦想 终于 要 实现 
了 。 直 到 1985 年 ， 人 们 还 在 嘲笑 奥 尔 森 的 “家 用 计算 机 ”的 断言 。 如 果 他 当时 预测 的 是 在 每 
个 背包 中 都 有 一 人 台 计 算 机 是 不 是 更 会 受到 人 们 的 嘲笑 呢 ? 


1.4 标准 组 织 

假设 你 想 有 一 台 漂 亮 的 新 型 LCD 宽屏 显示 器 ， 并 且 认为 稍微 转 转 商 场 就 可 以 找到 最 好 的 
价格 。 你 开始 打 电 话 、 上 网 搜索 、 开 和 车 在 城 里 转 ， 直 到 你 发 现 性 价 比 最 高 的 显示 器 。 根 据 经 
验 ， 你 知道 可 以 在 任何 地 方 购买 显示 器 并 且 都 能 在 你 的 系统 上 很 好 地 工作 。 你 能 做 出 这 样 的 假 
设 ， 是 因为 计算 机 设备 制造 商 已 经 同意 遵守 由 政府 和 行业 组 织 建立 的 连接 性 和 操作 规范 。 

在 制定 标准 的 组 织 中 ， 有 一 些 是 特 设 贸 易 协会 或 由 工业 领袖 组 成 的 联盟 。 制 造 商 知道 与 提 
出 不 同 或 不 兼容 的 规范 相 比 ， 为 一 个 特定 类 型 设备 建立 通用 指南 可 以 把 产品 销售 给 更 广泛 的 
受众 。 

一 些 标准 组 织 有 正式 的 章程 并 且 在 某 些 电子 和 计算 机 领域 的 权威 性 已 得 到 国际 公认 。 当 你 
继续 在 计算 机 组 成 和 体系 结构 方面 从 事 研究 工 作 时 ， 你 将 会 遇 到 由 这 些 组 织 制定 的 规范 ， 所 以 
应 该 了 解 一 些 关 于 这 些 组 织 的 事情 。 

电气 和 电子 工程 师 协会 (IEEE) 是 一 个 致力 于 电子 和 计算 机 工程 行业 进步 的 组 织 。IEEE 通过 
出 版 大 量 技术 文献 积极 提升 世界 范围 内 工程 社团 的 兴趣 。IEEE 也 为 各 种 计算 机 部 件 、 信 号 协议 、 
数据 表示 等 制定 标准 ， 这 仅仅 是 它 涉及 的 几 个 领域 。IEEE 有 一 个 创立 新 标准 的 过 程 ， 尽 管 这 个 
过 程 是 曲折 的 ,但 最 终 文档 是 备 受 推崇 的 并 且 在 需要 修订 之 前 通常 会 使 用 数 年 。 

国际 电信 联盟 (ITU) 总 部 设 于 瑞士 的 日 内 瓦 。ITU 以 前 称 为 国际 电报 电话 咨询 委员 会 。 顾 
名 思 义 ，ITU 关注 电信 系统 的 互 操作 性 ， 包 括 电 话 、 电 报 和 数字 通信 系统 。ITU 的 电信 和 分支 机 
构 (ITU-T) 已 经 建立 了 一 系列 标准 ， 你 会 在 文献 中 看 到 这 些 标准 ， 它 们 带 有 ITU-T 前 级 或 者 有 
CCITT 前 级 。 

包括 欧洲 共同 体 在 内 的 许多 国家 ， 都 会 委托 代表 机 构 在 各 种 国际 组 织 中 代表 国家 的 利益 。 
代表 美国 的 组 织 是 美国 国家 标准 学 会 (ANSI) 。 英 国 除了 在 欧洲 标准 化 委员 会 (CEN) 中 有 发 言 
权 外 ,还 有 自己 的 英国 标准 学 会 (BSI) 。 

国际 标准 化 组 织 (1SO) 是 一 个 实体 组 织 ， 协 调 全 世界 标准 的 开发 ， 包 括 ANSI 和 BSI 等 机 构 的 
活动 。IS0 不 是 一 个 缩写 ， 而 是 来 源 于 希腊 单词 isos， 意 思 是 “相等 "。ISO 有 超过 2800 个 技术 委 
员 会， 每 个 委员 会 负责 一 些 全 球 标准 化 问题 。 它 的 兴趣 范围 从 摄影 胶片 的 性 能 到 螺纹 间距 再 到 复 
杂 的 计算 机 工程 领域 。ISO 已 经 促进 了 全 球 贸易 增长 。 如 今 ，ISO 几乎 触及 我 们 生活 的 每 个 方面 。 

在 本 书 中 ,我 们 会 在 适当 的 地 方 提 及 官方 标准 符号 。 有 关 许 多 标准 的 很 详细 的 权威 信息 可 
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以 在 负责 建立 相关 标准 的 组 织 的 网 站 上 找到 。 许多 标准 包含 “规范 性 ”和 知识 性 参考 文献 ， 
这 些 参 考 文献 为 与 这 个 标准 相关 的 领域 提供 了 背景 信息 。 


1.5 发 展 历史 


在 计算 机 的 60 年 历程 中 ， 它 已 经 变 成 了 现代 化 设备 的 完美 案例 。 将 记忆 拉 回 到 速记 室 、 
复写 纸 和 油印 机 的 时 代 ， 这 些 神 奇 的 机 器 有 时 看 起 来 好 像 是 瞬间 就 成 了 我 们 现在 所 看 到 的 形 
式 。 但 是 计算 机 的 发 展 道路 是 由 偶然 发 现 、 商 业 推动 和 异想天开 所 铺 就 的 。 有 时 候 计 算 机 甚至 
通过 扎实 的 工程 应 用 实践 得 到 改进 ! 尽管 面临 着 曲折 、 改 变 和 技术 死胡同 ， 但 计算 机 还 是 以 无 
法 理解 的 速度 发 展 。 只 有 回顾 历史 时 ,我 们 才能 够 完全 理解 今天 的 成 就 。 

本 节 我 们 把 计算 机 的 演化 划分 为 代 ， 每 一 代 由 建造 计算 机 的 技术 所 定义 。 我 们 为 每 一 代 提 
ge 你 会 发 现 专 家 对 于 每 一 个 技术 时 代 准 确 的 开始 和 结束 时 间 的 意见 

民 少 一 致 。 

每 个 发 明 都 会 反映 它 所 处 的 时 代 ， 所 以 如 果 计 算 机 发 明 于 20 世纪 90 年 代 后 期 ， 那 么 人 们 
可 能 不 知道 它 是 否 应 该 称 为 计算 机 。 事 实 上 ， 我 们 见 到 过 多 少 从 放 在 桌子 上 或 桌 边 的 神秘 盒子 
里 流出 的 计算 ? 直到 最 近 ， 计 算 机 才 通 过 执行 令 人 费解 的 数学 运算 服务 于 我 们 。 不 再 局 限于 穿 
白 大 衬 的 科学 家 ,今天 的 计算 机 帮助 我 们 写 文档 ， 与 世界 各 地 喜欢 的 人 保持 联系 ， 进 行 网 上 购 
物 。 现 代 商 用 计算 机 仅仅 用 很 小 一 部 分 时 间 执 行 会 计 计 算 。 它 们 的 主要 目的 是 给 用 户 提供 大 量 
关于 竞争 优势 的 战略 信息 。 计 算 机 这 个 词 已 经 变 成 一 个 使 用 不 当 的 名 称 了 吗 ? 一 个 不 合 时 代 的 
名 称 ” 然而， 如 果 不 叫 计算 机 ， 那 么 我 们 应 该 叫 它们 什么 呢 ? 

我 们 无 法 呈现 完整 的 计算 历史 。 已 经 有 一 些 关 于 这 个 主题 的 完整 文章 ， 甚 至 这 些 文章 可 以 
让 读者 了 解 更 多 的 细节 。 如 果 我 们 已 经 激 起 你 的 兴趣 ， 那么 建议 你 去 查阅 本 章 末 尾 参 考 文献 中 
列 出 的 书籍 。 


1.5.1 第 零 代 : 机 械 计算 机 (1642 ~1945 年 ) 


在 16 世纪 之 前 ， 典 型 的 欧洲 商人 使 用 算盘 以 罗马 数字 来 计算 和 记录 算术 结果 。 在 十 进 制 
数字 系统 最 终 代 替 了 罗马 数字 之 后 ,许多 人 发 明了 执行 十 进 制 运算 更 快 和 更 准确 的 设备 。 
威廉 . 施 卡 德 (1592 一 1635 ) 被 认为 发 明了 第 一 个 机 械 计算 器 ， 即 计算 时 钟 (准确 的 日 期 不 详 ) 。 
这 个 设备 可 以 进行 6 位 数 以 内 的 加 减 运算 。1642 年 ， 布 莱 士 帕斯卡 (1623 一 1662 ) 开发 了 一 
个 名 为 Pascaline 的 机 械 计算 器 、 以 帮助 他 父亲 做 税务 工作 。Pascaline 能 够 执行 带 进位 的 加 法 和 
减法 运算 。 它 可 能 是 第 一 个 用 于 实用 目的 的 机 械 加 法 设备 。 事 实 上 ，Pascaline 的 设计 非常 好 ， 
以 至 于 它 的 基本 设计 在 20 世纪 初 仍然 在 使 用 ， 这 可 以 由 1908 年 的 闪电 便携 加 法 器 和 1920 年 
的 加 算 器 得 到 证 明 。 戈 特 弗 里 德 . 威廉 莱 布 尼 茨 (1646 一 1716 ) 是 著名 的 数学 家 ， 他 发 明了 一 
种 能 做 加 减 乘除 运算 的 计算 器 ， 称 为 Stepped Reckoner。 这 些 设备 都 不 能 编写 程序 也 没有 存储 
髓 ， 计 算 的 每 一 步 都 需要 人 工 干 预 。 

虽然 像 Pascaline 这 样 的 机 器 一 直 使 用 到 20 世纪 ,但 是 19 世纪 新 的 计算 器 设计 就 开始 出 现 
了 。 在 这 些 新 设计 中 最 具 潜 力 的 是 由 查尔斯 * 巴 贝 奇 (1791 一 1871 ) 设 计 的 差分 机 。 一 些 人 称 巴 由 
奇 为 “计算 之 父 ”。 据 记载 ， 他 是 一 个 古怪 的 天 才 ， 带 给 我 们 的 除了 其 他 东西 之 外 ， 还 有 万 能 钥 
是 和 “奶牛 捕手 ”( 一 种 把 奶牛 和 其 他 可 移动 障碍 物 推 到 火车 道外 的 设备 ) 。 

巴 贝 奇 在 1822 年 建造 了 差分 机 。 差 分 机 因为 使 用 了 一 种 叫 作 差分 法 的 计算 技术 而 得 名 。 

个 机 器 被 设计 为 可 机 械 化 地 解 多 项 式 函 数 ， 实 际 上 是 一 We le 
也 设计 了 一 个 名 为 分 析 机 的 通用 机 器 。 虽 然 巴 贝 奇 生前 未 能 完成 分 析 机 的 建造 ， 但 是 所 设计 的 分 
析 机 与 以 前 的 差分 机 相 比 有 更 多 用 途 。 分 析 机 具有 执行 任何 数学 运算 的 能 力 ， 包 括 许多 与 现代 计 
算 机 相关 的 部 件 : 一 个 执行 计算 的 算术 处 理 单元 ( 巴 贝 奇 称 其 为 工厂 ) 、 一 个 存储 器 ( 巴 贝 奇 称 其 





为 仓库 ) 和 输入 /输出 设备 。 在 巴 贝 奇 的 设计 中 还 包括 一 个 条 件 分 支 运算 ， 即 下 一 个 指令 的 执行 由 
前 面 的 运算 结果 来 决定 。 艾 达 是 洛 夫 莱 斯 伯 醚 夫人 和 诗人 和 拜 伦 勋 事 的 女儿 ， 她 建议 巴 贝 奇 写 一 个 
这 个 机 器 如 何 计算 数字 的 计划 。 这 被 视 为 第 一 个 计算 机 程序 ， 而 且 艾 达 被 认为 是 第 一 个 计算 机 程 
序 员 。 据 说 她 建议 使 用 二 进 制 系统 而 不 是 十 进 制 系统 存储 数据 

机 器 设计 者 面临 的 一 个 困扰 是 如 何 使 数据 进入 机 器 中 。 为 了 输入 和 编程 ， 巴 贝 奇 设 计 的 分 
析 机 使 用 了 一 种 穿孔 卡片 。 使 用 穿孔 卡片 控制 机 器 的 行为 并 不 是 巴 贝 奇 的 原创 ， 而 是 源 于 他 的 
一 个 朋友 一 一 约瑟夫 ' 玛丽 ' 雅 卡尔 (1752 一 1834)。1801 年 ， 雅 卡尔 发 明了 一 种 可 编程 的 织 
机 ， 这 种 织 机 可 以 在 布 上 织 出 复杂 的 图 样 。 雅 卡尔 给 了 巴 贝 奇 一 个 挂 毯 ， 这 个 挂 毯 就 是 在 织 机 
上 使 用 1 万 多 个 穿孔 卡片 织 成 的 。 在 巴 贝 奇 看 来 ， 如 果 织 机 可 以 由 卡片 来 控制 ， 那 么 他 的 分 析 
机 也 可 以 ， 这 看 起 来 很 自然 。 艾 达 对 此 想法 表达 了 她 的 喜悦 : “分 析 机 编排 代数 的 模式 就 像 雅 
卡尔 的 织 机 编织 花 和 叶 一 样 。 

穿孔 卡片 是 为 计算 机 系统 提供 输入 的 最 持久 的 方式 。 键 控 数 据 输入 直到 计算 机 器 的 构造 发 
生根 本 改变 后 才 得 以 实现 。19 世纪 后 半 叶 ， 绝 大 多 数 机 器 使 用 轮 式 机 构 ， 这 种 机 构 难 以 与 早 
期 的 键盘 集成 ， 因 为 它们 是 杠杆 装置 。 杠 杆 装置 容易 在 卡片 上 穿孔 ， 轮 式 设备 容易 阅读 。 所 以 
一 些 设备 被 发 明 出 来 ， 用 于 编码 并 把 穿孔 卡片 上 的 数据 制 成 表格 。19 世纪 末 最 重要 的 制 表 机 
器 由 赫 尔 曼 ' 霍 尔 瑞 斯 (1860 一 1929 ) 发 明 。 霍 尔 瑞 斯 的 机 絮 用 于 编码 并 编制 了 1890 年 的 人 口 
普查 数据 。 这 次 人 口 普查 以 创 纪录 的 时 间 完 成 ， 因 此 给 霍 尔 瑞 斯 增加 了 经 费 ， 也 提升 了 他 的 发 
明 的 声誉 。 霍 尔 瑞 斯 后 来 创建 的 公司 就 是 BM。 他 的 80 列 穿孔 卡片 名 为 霍 尔 瑞 斯 卡片 ， 其 作 
为 自动 数据 处 理 的 主要 产品 使 用 了 50 多 年 。 


一 种 前 现代 “计算 机 ” 骗局 


16 世纪 后 半 叶 已 经 能 看 到 第 一 次 工业 革命 的 锥 形 。 
珍妮 纺 纱 机 可 以 让 一 个 纺织 工人 完成 20 个 人 的 工作 ， 莱 
汽机 有 几 百 匹 马 的 力量 。 因 此 人 们 开始 对 各 种 机 械 着 迷 。 
把 正确 的 技巧 应 用 于 所 面临 的 问题 ， 似 乎 人 类 能 够 用 机 
器 做 任何 事情 ! | 

精巧 的 钟表 在 17 世纪 初 开始 出 现 。 复 杂 和 华丽 的 款 
式 点 级 着 教堂 和 市 政 厅 。 这 些 钟表 机 构 最 终 变 成 了 名 为 
自动 机 的 机 械 机 器 人 。 典 型 的 自动 机 可 以 演奏 长 笛 和 键 
盘 等 乐器 。17 世纪 中 叶 ， 最 好 的 自动 机 可 以 用 来 招待 欧 
洲 的 王室 。 一 些 人 依靠 诡计 娱乐 观众 ， 而 揭 开 骗局 就 成 
了 一 种 乐趣 。 奥 匈 帝 国 的 玛丽 - 泰 草 效 ( Marie-Therese) 皇 
后 依靠 一 个 富有 的 朝臣 和 名 为 沃 尔 夫 冈 - 冯 ， 肯 佩 伦 的 
工匠 ， 替 她 揭穿 这 些 可 笑 的 事情 。 一 天 ,在 一 个 令 人 印象 
特别 深刻 的 表演 之 后 ， 玛 丽 - 泰 曹 效 让 冯 “, 肯 佩 伦 做 一 
个 自动 机 ， 这 全 机 器 要 超越 所 有 她 见 到 过 的 自动 机 。 

冯 . 肯 佩 伦 接受 了 挑战 ， 经 过 几 个 月 的 工作 之 后 ， 








他 带 来 一 个 戴 头 中 、 抽 烟斗 的 下 棋 自动 机 。 对 于 所 有 人 ， en 

a 
包括 当时 最 好 的 棋 手 ， 这 个 “土耳其 人 ”都 是 一 个 难以 < : 
对 付 的 对 手 。 作 为 额外 的 装饰 ， 这 个 机 器 包含 一 组 隔 板 ， “土耳其 人 机 器 


来 源 : Robert Willis ，4m attempt to An- 


当 需 要 的 时 候 它 能 够 发 过， 将 军 的 声 音 。 这 个 机 器 alyse the Automaton Chess Player of Mr. de 
令 人 如 此 印象 深刻 ,在 84 年 间 吸 引 了 大 量 欧洲 和 美国 Kempelen. JK Booth, London. 1824. 





观众 。 

当然 ， 和 所 有 类 似 的 自动 机 一 样 ， 冯 ，。 肯 佩 伦 的 “土耳其 人 ”也 是 靠 欺 骗 实 现 惊人 之 举 
的 。 尽 管 一 些 聪明 的 反对 者 猜 出 了 它 是 如 何 操作 的 ， 但 是 “土耳其 人 ”的 秘密 从 未 被 泄露 : 
rd i je “土耳其 人 ”因此 成 了 科学 史上 最 早 并 且 最 令 人 印象 深 
刻 的 “计算 机 ”骗局 之 一 。 还 需要 200 年 才 会 有 不 靠 欺 骗 的 、 真 实 的 、 可 以 比赛 的 “土耳其 
机 器 。 


1.5.2 第 一 代 : 电子 管 计算 机 (1945 ~1953 年 ) 


虽然 巴 贝 奇 经 常 被 称 为 “计算 之 父 ”， 但 他 的 机 器 是 机 械 的 ， 不 是 电 或 电子 的 。20 世纪 
30 年 代 ， 康 拉 德 . 楚 泽 (1910 一 1995 ) 在 巴 贝 奇 的 基础 上 增加 了 电 的 技术 ， 并 对 巴 贝 奇 的 设 
计 进行 了 其 他 改进 。 楚 泽 的 计算 机 Z1 使 用 机 电 式 继电器 代替 了 巴 贝 奇 机 器 的 手 摇 齿 轮 。2Z1 
可 编程 并 有 一 个 存储 器 、 一 个 算术 单元 和 一 个 控制 单元 。 由 于 战争 时 期 的 德国 缺乏 资金 和 
资源 ， 所 以 楚 泽 使 用 废弃 的 电影 胶片 替代 穿孔 卡片 作为 输入 。 按 照 设 计 ， 他 的 机 器 应 该 使 
用 电子 管 ， 但 是 当时 楚 泽 买 不 起 电子 管 。 因 此 ， 虽 然 没 有 使 用 电子 管 ， 但 Z1 确实 属于 第 一 
代 计 算 机 。 

Z1 是 楚 泽 在 柏林 父母 家 的 客厅 里 建造 的 ， 当 时 德国 正在 与 欧洲 绝 大 多 数 国 家 打仗。 幸运 
的 是 ， 他 没 能 说 服 纳粹 购买 他 的 机 器 。 他 们 没有 意识 到 这 样 一 个 设备 会 给 他 们 带 来 的 战术 优 
势 。 盟 军 的 炸弹 炸 毁 了 楚 泽 所 有 最 早 的 3 个 系统 Z1 、Z2 和 Z3 。 直 到 战争 结束 楚 泽 的 令 人 印象 
深刻 的 机 器 都 不 能 得 到 细 化 ， 而 且 最 终 成 为 计算 机 史上 男 一 个 “进化 的 死胡同 ”。 

正如 我 们 今天 所 知道 的 ， 数 字 计 算 机 是 在 20 世纪 30 年 代 到 40 年代 许 多 人 的 工作 成 果 。 
帕斯卡 的 基本 机 械 计 算 器 由 很 多 人 同时 设计 和 修改 ,现代 电子 计算 机 也 同样 如 此 。 尽 管 关 于 谁 
建造 了 第 一 台 计 算 机 的 争论 不 断 , 但 下 面 3 个 人 作为 现代 计算 机 的 发 明 者 脱颖而出 : 约翰 阿 
塔 纳 索 夫 、 约 翰 ' 葛 克 利和 J 普 瑞 斯 伯 … 艾 克 特 。 

第 一 个 完整 的 电子 计算 机 的 建造 归功 于 约翰 阿 塔 纳 索 夫 (1904 一 1995 ) 。 阿 塔 纳 索 夫 - 贝 
瑞 计算 机 (Atanasoff Berry Computer，ABC ) 是 一 个 用 电子 管 建造 的 二 进 制 计算 机 。 因 为 这 个 系统 
专 为 解决 线性 方程 组 的 问题 而 建造 ， 所 以 我 们 不 能 称 它 为 通用 计算 机 。 然 而 ，ABC 有 一 些 特征 
与 几 年 后 发 明 的 通用 ENIAC( 电 子 数 字 积 分 计算 机 ) 相同 。 这 些 共同 特征 引起 了 关于 电子 数字 
计算 机 的 发 明 ( 和 专利 权 ) 应 该 归功 于 谁 的 相当 大 的 争议 。( 有 兴趣 的 读者 可 以 在 涉及 阿 塔 纳 索 
夫 和 ABC 的 相当 宛 长 的 法 律 诉讼 中 找到 更 详细 的 内 容 ， 见 参考 文献 Mollenhoff[ 1988 ] 。) 

约翰 莫 克 利 (1907 一 1980) 和 丁 普 瑞 斯 伯 … 艾 克 特 (1929 一 1995 ) 是 1946 年 发 明 的 ENIAC 
的 两 个 主要 发 明 人 。ENIAC 被 公认 为 是 第 一 个 全 电子 的 通用 数字 计算 机 。 这 个 机 器 使 用 了 17 
468 个 电子 管 ， 占 地 1800ft* ， 重 达 30t， 耗 电 174kW。ENIAC 有 1000 个 信息 位 (大 约 20 个 10 位 
十 进 制 数 ) 的 存储 容量 ， 使 用 穿孔 卡片 存储 数据 。 

约翰 莫 克 利 对 于 电子 计算 机 器 的 想象 力 ， 源 于 他 以 数学 方式 预报 天 气 的 终身 兴趣 。 在 费 
城 附近 的 伍 西 努 斯 学 院 担任 物 理学 教授 期 间 ， 莫 克利 发 明了 几 十 个 加 法 机 器 ， 学 生 操作 员 处 理 
成 堆 的 数据 ， 因 为 他 认为 这 会 揭示 数学 关系 背后 的 天 气 模式 。 他 认为 ， 如 果 计 算 能 力 能 够 再 强 
一 点 ,那么 他 就 可 以 达到 这 个 似乎 超出 他 能 力 的 目标 。 根 据 盟 军 战争 的 结果 ， 为 了 学 习 电 子 计 
算 ， 莫 克利 自愿 参加 了 宾夕法尼亚 大 学 摩尔 工程 学 院 的 电子 工程 速成 班 。 学 习 完 这 个 课程 之 
后 ， 莫 克利 在 摩尔 工程 学 院 得 到 了 一 个 教 职 ， 在 那里 他 教 了 一 个 名 叫 丁 普 瑞 斯 伯 ' 艾 克 特 的 
聪明 学 生 。 莫 克利 和 艾 克 特 有 一 个 共同 的 兴趣 ， 即 建造 一 台电 子 计算 设备 。 为 了 确保 建造 机 器 
需要 的 资金 ， 他 们 写 了 一 个 正式 的 建议 交 由 学 校 审查 。 他 们 尽 可 能 保守 地 描绘 这 台 机 器 ， 把 它 
称 为 “自动 计算 器 "” 。 虽 然 他 们 可 能 知道 使 用 二 进 制 编码 系统 的 计算 机 能 够 最 有 效 地 工作 ， 但 


下 





是 为 了 适应 大 型 电子 加 法 机 器 的 建造 ， 
绝 了 莫 克 利和 艾 克 特 的 建议 。 幸 运 的 是 ， 
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The Army’s ENIAC ¢an give you the 
answer in a fraction of a second! 


Think that’s a stumper? You should see some 
of the ENIAC’s problems! Brain twisters that 
if put to paper would run of this page and 
feet beyond . . . addition, subtraction, multi- 
plication, division — square root，cube root, 
any root. Solved by an incredibly complex 
system of circuits operating 18.000 electronic 
tubes and tipping the scales at 30 tons! 

The ENIAC is symbolic of many amazing 
\rmy devices with a brilliant future for you! 
The new Regular Army needs men with apti- 
tude for scientific work, and as one of the first 
trained in the post-war era, you stand to get 
in on the ground floor of imporlant jobs 


YOUR REGULAR ARMY SERVES THE NATION 
AND MANKIND IN WAR AND PEACE 


HOW MUN (9 LAI8F “2 





英 克 利和 艾 克 特 设计 的 系统 使 用 的 是 十 进 制 数 
美国 军 方 对 此 很 感 兴趣 


四 





which have never before existed. You'll fnd 
that an Army career pays off. 

The most attractive fields are filling 
quickly. Cet into the swim while the getting s 
good! 112, 2 and 3 year enlistments are open 
in the Regular Mrmy to ambitious young men 
]8 to 34 (17 


otherwise qualified. If you enlist for 3 years, 


with parents’ consent) who are 


you may choose your own branch of the ser- 
vice, of those still open. Get full details at 


your nearest Army Recruiling Station. 


A GOOD JOB FOR YOU 


U. $. Army 


CHOOSE THIS 
(A! 





学 校 拒 


1946 年 美军 的 征兵 海报 
在 第 二 次 世界 大 战 期 间 ， 军 队 对 于 计算 新 弹道 武器 的 轨迹 的 需求 无 法 满足 。 他 们 雇用 了 数 
千 人 充当 “计算 机 ”， 为 了 计算 射击 表 ， 这 些 人 旋转 着 仪器 曲柄 进行 所 要 求 的 计算 。 当 意识 到 
-台电 子 设备 可 以 把 弹道 表 计 算 时 间 从 几 天 缩短 到 几 分 钟 后 ， 军 队 资 助 了 ENIAC。 而 ENIAC 
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确实 把 计算 一 个 弹道 表 的 时 间 从 20h 缩短 到 30s。 不 幸 的 是 ， 这 台 机 器 直到 战争 结束 都 设 有 准 
备 好 。 但 是 ae 
不 断 改进 ， 并 在 商业 上 取得 了 成 功 。 


什么 是 电子 管 ? 


今天 我 们 所 知道 的 有 线 世 界 都 诞生 于 一 个 名 为 电子 管 的 电子 装置 。 美 国人 称 电 子 管 为 真 
空 管 ， 而 英国 人 称 电子 管 为 阀 ， 这 种 叫 法 更 准确 。 电 子 管 应 该 称 
为 阔 ， 因 为 它们 控制 着 电子 系统 中 的 电流 ， 就 像 阀 控制 着 管道 系 
统 中 的 水 流 一 样 。 事 实 上 ，20 世纪 中 期 的 一 些 电子 管 产品 并 不 
是 真空 的 ， 而 是 填充 了 导电 气体 ， 比 如 乘 蒸 气 ， 它 可 以 提供 理想 
的 电气 性 能 。 

这 种 使 管子 工作 的 电 现象 是 爱迪生 在 1883 年 发 现 的 ， 当 时 他 
试图 找到 灯泡 通电 后 使 灯丝 保持 燃烧 (或 氧化 ) 几 分 钟 的 方法 。 爱 
迪生 认为 将 灯丝 放 入 真空 中 可 以 防止 氧化 。 爱 迪生 并 不 知道 空气 
不 仅 助 燃 ， 而 且 也 是 很 好 的 绝缘 体 。 当 他 给 新 连接 的 钨 丝 电极 通 
电 时 ， 就 像 以 前 一 样 ， 灯 丝 不 久 就 变 热 并 烧毁 了 。 然 而 ， 这 次 爱 
迪生 注意 到 虽然 灯丝 烧 断 了 ， 但 是 电 仍 持续 地 从 灯泡 内 暖 的 负 端 
流向 冷 的 正 端 。1911 年 ， 欧 文 * 威 兰 斯 ， 理 查 条 从 太 了 入 种 纲 夭 。 他 得 出 的 结论 是 ， 当 带 负 
电荷 的 灯丝 被 加 热 时 ， 电 子 就 会 “沸腾 ”， 就 像 可 以 者 ps pny 他 形象 地 将 这 
种 现象 称 为 热电 子 发 射 

正如 爱迪生 所 记录 的 那样 ， 热 电子 发 射 被 许多 人 认为 只 是 电 的 一 种 奇特 的 特性 。 但 是 1905 
年 ， 爱 迪生 的 前 助理 英国 人 约翰 。，A. 弗 莱 明 (John A. Fleming) 看 出 爱迪生 的 发 现 不 仅仅 是 新 
奇 。 他 知道 热电 子 发 射 仅 支持 电子 在 一 个 方向 流动 : 从 带 负 电荷 的 阴极 到 带 正 电荷 的 阳极 ， 也 
称 其 为 板 极 。 他 意识 到 这 种 行为 可 以 整流 交流 电 。 也 就 是 说 ， 它 可 以 将 交流 电 变 成 直流 电 ， 这 
对 电报 设备 的 正常 运行 至 关 重 要 。 绅 莱 明 用 他 的 思想 发 明了 一 个 电子 阀 ， 后 来 称 为 二 极 管 或 整 


流 器 。 
"YY yyy 


二 极 管 非常 适合 将 交流 电 变 成 直流 电 ， 但 是 电子 管 的 最 大 功用 还 没有 被 发 现 。1907 年 ， 
美国 人 李 dit 第 三 个 极 ， 即 控制 栅 极 。 当 控制 栅 极 携带 负电 荷 
时 ， 可 以 减少 或 防止 电子 从 二 极 管 的 阴极 流向 阳极 。 














在 阴极 和 控制 栅 在 阴极 加 负电 荷 ， 
极 加 负电 荷 ， 在 在 控制 栅 极 和 阳极 
阳极 加 正 电 荷 。 加 正 电 荷 。 电 子 从 
电子 靠近 阴极 阴极 移动 到 阳极 


当 德 弗 雷 斯 特 为 他 的 装置 申请 专利 时 ， 他 将 其 称 为 三 极 检 波 管 。 它 后 来 被 称 为 三 极 管 。 下 
页 右 图 给 出 了 三 极 管 的 原理 图 符号 。 





三 极 管 既 可 以 用 作 开 关 也 可 以 用 作 放 大 器 。 在 控制 顶 极 上 电荷 的 微小 变化 能 够 引起 阴极 和 
阳极 之 间 的 电流 的 很 大 变化 。 因 此 ， 一 个 施加 于 栅 极 的 弱 信 号 产生 的 结果 


是 在 板 极 输出 一 个 强 很 多 的 信号 。 若 一 个 足够 大 的 负电 荷 施加 到 顶 极 ， 则 ”得 es 
会 蛆 止 所 有 的 电子 离开 阴极 。 

最 终 加 到 三 极 管 中 的 控制 柚 极 允许 更 精确 地 控制 电流 。 有 两 个 栅 极 的 阳极 
管子 称 为 四 极 管 ， 有 三 个 柚 极 的 管子 称 为 五 极 管 。 三 极 管 和 五 极 管 是 最 党 二 


用 在 通信 和 计算 机 应 用 中 的 管子 。 通 常 ， 两 个 或 三 个 三 极 管 或 五 极 管 组 合 

在 一 个 封套 内 ， 所 以 它们 能 共用 一 个 加 热 器 以 减少 特定 装置 的 功 耗 。 这 些 现 代 设 备 称 为 “小 
型 ” 管 ， 因 为 它们 大 多 高 约 2in(5cm) 、 直 径 为 0.5in(1.5cm)。 二 极 管 、 三 极 管 和 五 极 管 的 大 
小 比 家 用 灯泡 要 小 一 些 。 
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电子 管 不 适合 建造 计算 机 。 甚 至 最 简单 的 电子 管 计算 机 也 需要 数 千 只 管子 。 加 热 这 些 器 件 
的 阴极 需要 巨大 的 电能 。 为 了 防止 烧 坏 设备 ， 热 量 必须 尽快 从 系统 中 排出 。 在 较 低 的 电压 下 运 
行 阴极 加 热 器 ， 可 以 减少 功 耗 和 散热 。 但 是 ， 这 样 做 会 使 管子 的 开关 速度 变 得 更 慢 。 尽 管 存在 
局 限 性 和 功 耗 问题 ， 但 是 由 电子 管 建造 的 模拟 计算 机 系统 和 数字 计算 机 系统 仍 使 用 了 很 多 年 ， 
是 所 有 现代 计算 机 系统 的 架构 基础 。 

虽然 制造 电子 管 计算 机 已 经 是 几 十 年 前 的 事 了 ， 但 是 电子 管 仍然 用 在 音频 放大 器 中 。 这 些 “高 
端 ” 放 大 器 受到 音乐 家 的 青睐 ， 他 们 认为 电子 管 提 供 的 洪亮 悦耳 的 声音 是 固态 器 件 无 法 达到 的 。 


1.5.3 第 二 代 : 晶体 管 计算 机 (1954 ~1965 年 ) 

第 一 代 电 子 管 技 术 不 是 非常 可 靠 。 事 实 上 ， 一 些 ENIAC 的 反对 者 认为 该 系统 不 可 能 运行 ， 
因为 管子 烧毁 的 速度 比 更 换 管子 的 速度 还 要 快 。 虽然 系统 的 可 靠 性 没有 预言 者 预测 的 那么 糟 
糕 ,， 但 是 电子 管 系统 的 停机 时 间 往 往 比 正常 运行 时 间 更 多 。 

1948 年 ， 贝 尔 实验 室 的 3 位 研究 人 员 一 一 约翰 巴 丁 、 沃 尔 特 布 拉 顿 和 威廉 ， 肖 克 
利 一 发 明了 晶体 管 。 这 项 新 技术 不 仅 革新 了 电视 机 和 收音 机 等 设备 ， 而 且 也 推动 计算 机 工业 
进入 新 的 一 代 。 因 为 晶体 管 比 电 子 管 耗 电 少 、 体 积 更 小 ， 而 且 工 作 更 可 靠 ， 所 以 计算 机 中 的 电 
路 变 得 更 小 也 更 可 靠 。 尽 管 使 用 了 晶体 管 ， 但 这 一 代 计 算 机 体积 仍然 庞大 且 价 格 昂贵 ， 通 常 只 
有 大 学 、 政 府 和 大 型 企业 能 用 得 起 。 然 而 ， 在 这 一 代 中 出 现 了 大 量 计算 机 制造 商 。IBM 、DEC 
(数字 设备 公司 ) 和 Univac( 现在 的 Unisys ) 等 在 计算 机 工业 中 占据 了 主导 地 位 。IBM 制造 、 销 售 
了 用 于 科学 应 用 的 7094 计算 机 和 用 于 商用 的 1401 计算 机 。DEC 忙于 制造 PDP - 1 计算 机 。 莫 
克利 和 艾 克 特 成 立 了 Univac 系统 公司 (但 很 快 出 售 ) 。 这 一 代 最 成 功 的 Unisys 系统 当 属 1100 系 
列 。 另 外 一 个 公司 CDC (控制 数据 公司 ) 在 西 摩 . 克 雷 的 管理 下 建造 了 世界 上 第 一 台 超 级 计算 
机 CDC 6600。1000 万 美元 的 CDC 6600 每 秒 可 以 执行 1000 万 条 指令 ， 使 用 60 位 字 ， 有 一 个 惊 
人 的 128K 字 的 主 存储 器 。 





文 个 词 的 英文 (transistor) 由 transfer 的 词 头 和 resistor 的 词尾 拼 在 一 起 构成 。 晶 体 管 
态 版 本 。 没 有 四 极 管 或 五 极 管 的 固态 版 本 。 电 子 在 固态 介质 中 比 在 电子 管 的 开放 
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空隙 中 表现 更 好 ， 所 以 不 需要 额外 的 控制 栅 极 。 钳 或 硅 可 以 作为 固态 器 件 的 基本 “固体 "。 在 
纯净 状态 下 ， 这 些 元 素 都 不 是 电 的 良 导 体 。 但 是 ， 
当 它们 与 元 素 周期 表 中 和 它们 相 邻 的 微量 元 素 相 结 
合 时 ， 能 以 有 效 和 容易 控制 的 方式 导电 。 

在 元 素 周 期 表 中 ， 在 硅 和 和 钱 的 左边 可 以 找到 硼 、 
铝 各 销 。 因 为 它们 位 于 硅 和 鲁 的 左边 ， 所 以 它们 的 
外 层 电子 过 中 少 一 个 电子 ， 或 者 化 合 价 (valence ) 少 
1。 因 此 ， 如 果 加 少量 的 铝 到 硅 中 ， 在 硅 的 外 层 电子 
壳 中 会 有 轻微 的 不 平衡 ， 所 以 它 就 会 从 有 负电 位 ( 剩 
余 电子 ) 的 电极 上 吸引 电子 。 当 用 这 种 方式 改变 或 斤 
杂 硅 或 错时 ， 它 们 就 变 成 了 一 种 P 型 材料 。 

与 此 类 似 ， 如 果 加 一 些 磷 (phosphorus ) 、 砷 (arse- 
nic ) 或 锁 (antimony ) 到 硅 中 ， 在 硅 的 外 层 电子 这 中 就 会 
有 剩余 电子 。 这 样 我 们 就 获得 了 一 种 N 型 材料 。 如 
果 在 N 型 材料 中 提供 松散 电子 ， 那 么 就 会 有 少量 的 
电流 流 过 NN 型 材料 。 换 名 话说 ， 如 果 把 正 电 位 加 到 
N 型 材料 上 ， 电 子 将 从 负极 流向 正极 。 如 果 电 极 被 反 
转 ， 也 就 是 说 ， 把 负电 位 加 到 N 型 材料 上 并 且 把 正 
电位 加 到 了 型 材料 上 ， 那 么 将 不 会 有 电流 流 过 。 这 意味 着 我 们 能 用 N 型 材料 和 了 型 材料 的 简单 
结合 制造 固态 二 极 管 。 

固态 三 极 管 ( 即 晶体 管 ) 由 三 层 半导体 材料 组 成 。 一 片 P 型 材料 夹 在 两 片 N 型 材料 中 间 ， 
或 者 一 片 N 型 材料 夹 在 两 片 P 型 材料 中 间 。 前 者 称 为 NPN 晶体 管 ， 后 者 称 为 PNP 晶体 管 。 晶 
体 管 的 内 层 称 为 基 极 ,其 他 两 层 分 别称 为 集 电 极 和 发 射 极 。 

右 侧 的 图 标示 出 电流 如 何 通 过 NPN 和 PNP 晶体 管 。 在 晶体 管 中 基 极 的 作用 就 像 三 极 电子 
中 的 控制 栅 极 : 在 晶体 管 基 极 上 电流 的 微小 变化 会 导致 从 发 射 极 到 集 电极 产生 一 个 大 电流 。 

顶部 的 图 中 展示 了 一 个 封装 形式 为 “TO-50” 的 分 立 元 件 晶 体 管 。( 译 者 注 : TO-xxx 表示 
晶体 管 的 封装 结构 ，TO 是 Transistor Out-line 的 缩写 ， 
xxx 表示 晶体 管 的 外 形 。) 只 有 3 根 导线 连接 晶体 管 的 
基 极 、 发 射 极 和 集 电 极 到 电路 的 其 余部 分 。 晶 体 管 
不 仅 比 电子 管 小 ， 而 且 在 运行 时 发 热 少 且 更 可 靠 。 
电子 管 灯 丝 (就 像 灯 泡 灯 丝 一 样 ) 会 发 热 和 烧毁 。 使 
用 晶体 管 元 件 的 计算 机 比 使 用 电子 管 的 计算 机 体积 
自然 更 小 而 且 发 热 更 少 。 然 而 ， 最 终 的 小 型 化 并 不 
是 由 离散 晶体 管 取 代 单 个 三 极 管 实现 的 ， 而 是 把 整 
个 电路 缩小 到 一 个 硅 片 上 。 

集成 电路 (或 芯片 ) 包含 数 百 到 数 十 亿 个 微小 的 
晶体 管 。 有 几 种 用 于 制造 集成 电路 的 不 同 技术 。 最 
简单 的 方法 是 使 用 计算 机 辅助 设计 软件 创建 一 个 电 
路 ， 这 个 软件 可 以 打印 形成 芯片 的 几 个 硅 层 的 大 
图 。 就 像 用 底片 洗 照片 一 样 ， 用 光 透 过 图 照射 硅 的 
表面 ， 图 上 有 光 阻 物质 的 区 域 和 没有 光 阻 物质 的 区 域 会 引起 透射 光 的 变化 ， 当 硅 片 浸入 一 
种 化 学 物质 中 时 ， 硅 的 曝光 区 域 的 感光 材料 被 冲 走 ， 在 芯片 表面 就 会 产生 电路 的 精致 图 案 。 
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这 项 技术 称 为 微 光 刻 。 在 蚀刻 完成 后 ， 就 可 以 在 芯片 有 四 痕 的 表面 上 沉积 一 层 N 型 或 P 型 
材料 。 然 后 ， 对 这 一 层 材 料 再 进行 上 曝光、 蚀刻。 这 个 过 程 一 直 持 续 到 所 有 的 层 都 蚀刻 完 。 由 
P 型 和 NN 型 材料 产生 的 波峰 和 低谷 形成 了 微观 电子 元 件 ( 包 括 晶 体 管 )， 这 样 得 到 的 电路 就 
像 以 前 由 分 立 元 件 制 成 的 更 大 部 件 一 样 ， 但 是 这 样 的 电路 运行 速度 更 快 ， 消 耗 的 电量 只 是 
原来 的 一 小 部 分 。 


1.5.4 第 三 代 : 集成 电路 计算 机 (1965 ~1980 年 ) 


真正 大 量 地 使 用 计算 机 源 于 集成 电路 的 产生 。 杰 克 … 基 尔 比 发 明了 由 错 制 造 的 集成 电路 
(IC) 或 称 为 微 芯 片 。6 个 月 之 后 ， 一 直 致 力 于 集成 电路 设计 的 罗伯特 诺 伊 斯 使 用 硅 替 代销 
创造 了 一 个 类 似 的 器 件 。 这 就 是 硅 芯 片 。 计 算 机 工业 就 是 建立 在 硅 芯 片 之 上 的 。 早 期 的 集 
成 电路 可 以 在 一 个 比 “分 立 元 件 ” 晶 体 管 还 要 小 的 硅 片 上 放 几 十 个 晶体 管 。 计 算 机 变 得 更 
快 、 更 小 也 更 便宜 ， 这 使 处 理 能 力 获得 了 巨大 的 提升 。 tag 

IBM System/360 系列 计算 机 是 第 一 批 完 全 由 固态 元 件 建 “= 

造 的 商用 系统 。360 产品 线 也 是 IBM 提供 的 第 一 个 所 有 
系列 机 的 全 兼容 产品 线 ， 即 系列 中 的 所 有 计算 机 都 使 用 
相同 的 汇编 语言 。 使 用 较 小 机 器 的 用 户 可 以 升级 到 更 大 
的 系统 ， 并 不 需要 重 写 所 有 软件 。 在 当时 ， 这 是 一 个 革 
命 性 的 新 概念 。 

在 集成 电路 时 代 也 看 到 了 分 时 和 多 程序 设计 ( 多 人 
同时 使 用 计算 机 的 能 力 ) 的 引入 。 多 程序 设计 反 过 来 需 
要 为 这 些 计 算 机 引入 新 的 操作 系统 。 分 时 小 型 计算 机 
如 DEC 的 PDP-8 和 PDP-11， 使 较 小 的 企业 和 更 多 的 大 
学 都 能 付 得 起 计算 费用 。 利 用 集成 电路 技术 也 可 以 开 
发 更 强大 的 超级 计算 机 。 西 摩 * 克 雷 用 他 在 建造 CDC 面世 7 天 关机 元 作 乓 是 杰 
6600 时 学 到 的 东西 创办 了 自己 的 公司 一 一 克 雷 研究 公 。 顺 时 针 ， 从 顶部 开始 ， 

司 。 从 1976 年 的 880 万 美元 的 Cray-1 开始 ， 这 家 公司 1) 电子 管 

生产 了 许多 超级 计算 机 。 与 CDC 6600 形成 鲜明 对 比 的 。 3) 包含 3200 人 2 入 入 与 非 站 的 芝 

是 ，Cray-1 每 秒 可 以 执行 的 指令 数 超过 1.6 亿 条 ， 可 4) 集成 电路 封装 ( 左下 角 的 小 正方 形 是 一 
以 支持 8MB 的 存储 器 。 电 子 管 、 晶 体 管 和 集成 电路 的 。 个 集成 电路 ) 

尺寸 比较 参见 图 1 来 源 : 由 琳 达 ' 纳 尔 (Linda Null) 提供 
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1.5.5 第 四 代 : 超大 规模 集成 电路 计算 机 (1980 ~ ) 


在 第 三 代 电 子 进 化 中 ， 多 个 晶体 管 可 集成 到 一 个 芯片 上 。 随 着 制造 技术 和 芯片 技术 的 进 
步 ， 越 来 越 多 的 晶体 管 可 封装 在 一 个 芯片 上 。 现 在 有 多 种 集成 技术 : 小 规模 集成 (SSI) ， 每 个 
必 片 上 有 10 ~ 100 个 元 器 件 ; 中 等 规模 集成 (MSI) ， 每 个 芯片 上 有 100 ~ 1000 个 元 器 件 ; 大 规 
模 集 成 (LSI) ， 每 个 芯片 上 有 1000 ~ 10 000 个 元 器 件 ; 超大 规模 集成 (VLSI) ， 每 个 芯片 上 有 超 
过 10 000 个 元 器 件 。 超 大 规模 集成 电路 标志 着 第 四 代 计 算 机 的 开始 。 随 着 更 多 的 晶体 管 不 断 加 
入 ， 集 成 电路 的 复杂 性 持续 增长 。 对 于 包含 超过 100 万 个 晶体 管 的 集成 电路 ， 建 议 使 用 特大 规 
模 集 成 (ULSI) 这 个 词 。2005 年 ， 数 十 亿 品 体 管 可 放置 在 一 个 芯片 上 。 其 他 有 用 的 术语 包括 : 
唱片 规模 集成 (WSI) ， 它 用 整个 硅 晶 片 建造 超级 芯片 集成 电路 ; 三 维 集成 电路 (3D-IC); 片上 
系统 (SOC) ， 它 是 包括 整个 计算 机 所 需 的 所 有 元 件 的 集成 电路 。 

为 了 对 表示 集成 水 平 的 数字 有 更 多 的 认识 ,考虑 “片上 ENIAC 项 目 " 。1997 年 ， 为 了 纪念 
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ENIAC 首次 公开 展示 五 十 周年 ， 宾 夕 法 尼 亚 大 学 的 一 群 学 生 构建 了 一 个 与 ENIIAC 等 效 的 单 片 
机 。 学 生 们 把 占 地 1800ft 、 重 30t、 开 机 运行 时 每 分 钟 消耗 174kW 电量 的 庞然大物 ENIAC 复制 
到 了 一 个 指甲 大 小 的 世 片 上 。 这 个 芯片 包含 大 约 174 569 个 晶体 管 ， 这 个 数量 比 20 世纪 90 年 
代 后 期 在 同样 大 小 的 硅 片 上 通常 放置 的 元 器 件数 量 少 一 个 数量 级 。 

1971 年 ，Intel 公司 使 用 超大 规模 集成 技术 创建 了 世界 上 第 一 个 微 处 理 器 一 一 4004， 这 是 
一 个 全 功能 的 4 位 系统 ， 主 频 为 108KHz。Jntel 公司 也 推出 了 可 在 一 个 芯片 上 容纳 4kb 主 存 的 
随机 存 取 存 储 器 (RAM) 芯片 。 这 使 得 第 四 代 计 算 机 变 得 比 其 固态 前辈" 更 小 并 且 更 快 。 

超大 规模 集成 技术 以 及 令 人 难以 置信 地 越 做 越 小 的 电路 ， 推 动 了 微型 计算 机 的 发 展 。 这 些 
系统 足够 小 有 旦 价格 足够 便宜 ， 因 此 可 使 普通 民众 用 得 起 计算 机 。 最 早 的 微型 计算 机 是 Altair 
8800， 它 由 MITS 公司 于 1975 年 发 布 。 紧 随 其 后 的 是 Apple 1 和 Apple 工 ， 以 及 科 莫 多 尔 公 司 的 
PET 和 Vic 20。 最 后 ，1981 年 IBM 推出 了 个 人 计算 机 (PC ) 。 

个 人 计算 机 是 IBM 在 生产 “入 门 级 ”计算 机 系统 方面 的 第 三 次 尝试 。IBM 的 Datamaster 和 
5100 系列 台式 计算 机 在 市 场 上 彻底 失败 了 。 尽 管 这 些 早期 产品 失败 了 ,但 是 IBM 的 约 输 * 奥 
佩 尔 还 是 说 服 了 管理 者 再 试 一 次 。 他 建议 在 佛罗里达 州 博 卡拉 顿 市 成 立 一 个 完全 有 自主 权 的 独 
立业 务 部 门 ， 远 离 设 在 纽约 市 阿 蒙 克 的 IBM 公司 总 部 。 奥 佩 尔 让 既 有 活力 又 有 能 力 的 工程 师 唐 
“ 埃 斯 特 奇 进行 代号 为 Acorn 的 新 系统 开发 。 由 于 受到 IBM 在 小 型 机 系统 领域 失败 的 影响 ， 公 
司 管理 层 严 格 控制 该 项 目的 时 间 和 资金 。 奥 佩 尔 只 有 承诺 在 一 年 内 交付 这 个 项 目 ， 公 司 才 能 让 
项 目 启动 。 这 似乎 是 一 件 不 可 能 完成 的 事情 。 

埃 斯 特 奇 知 道 唯一 能 够 在 过 于 乐观 的 12 个 月 内 完成 项 目的 方法 ， 就 是 要 打破 IBM 的 惯例 ， 
尽 可 能 使 用 现成 的 部 件 。 因 此 ， 从 一 开始 ，IBM 的 PC 就 被 设想 为 一 种 “开放 ”的 体系 结构 。 虽 
然 IBM 的 一 些 人 后 来 可 能 对 让 PC 的 体系 结构 尽 可 能 非 专利 的 决定 感到 后 悔 ,但 是 正 是 这 种 开放 
让 IBM 建立 了 行业 标准 。 克 隆 PC 发 展 迅 猛 ， 而 IBM 的 竞争 对 手 忙 于 起 诉 复 制 其 系统 设计 的 公 
司 。 不久,“IBM 兼容 ”微型 计算 机 的 价格 就 降 到 了 几乎 每 个 小 企业 都 可 以 购买 的 程度 。 也 要 感 
谢 克 隆 市 场 ， 大 量 这 种 系统 很 快 在 人 们 的 家 中 实现 了 真正 的 “个 人 使 用 ”。 

IBM 最 终 失 去 了 微型 计算 机 市 场 的 统治 地 位 。 无 论 好 与 坏 ，IBM 的 体系 结构 事实 上 一 直 是 
微型 计算 机 的 标准 ， 每 年 都 有 更 大 、 更 快 的 系统 出 现 。 今 天， 普通 台式 计算 机 的 计算 能 力 已 经 
是 20 世纪 60 年 代 大 型 机 的 许多 倍 了 。 

自 20 世纪 60 年 代 以 来 ， 由 于 超大 规模 集成 电路 技术 的 出 现 ， 大 型 计算 机 的 性 价 比 有 了 人 惊 
人 的 改进 。 虽 然 IJBM System/360 是 一 个 全 固态 元 器 件 的 系统 ， 但 它 仍 然 是 需要 用 水 冷却 、 消 耗 
电力 的 庞然大物 。 它 每 秒 仅 能 执行 50 000 条 指令 ， 仅 支持 16MB 的 内 存 ( 而 通常 只 装 有 几 KB 的 
物理 存储 器 ) 。 这 些 系统 太 昂贵 ， 只 有 最 大 的 企业 和 大 学 可 以 买 或 租 一 台 。 大 型 机 现在 称 为 
“企业 服务 器 ”， 价 格 仍然 是 数 百 万 美元 ， 但 是 它们 的 处 理 能 力 已 经 有 了 数 千 倍 的 增长 ,在 20 
世纪 90 年 代 后 期 ， 过 了 每 秒 10 亿 条 指令 的 大 关 。 这 些 系统 通常 作为 网 络 服务 器 来 使 用 ， 每 分 
钟 支持 几 十 万 个 业务 1 

由 VLSI 带 给 超级 计算 机 的 处 理 能 力 让 人 不 敢 相信 。 第 一 台 超 级 计算 机 CDC 6600 每 秒 能 够 
执行 1000 万 条 指令 ， 主 存 的 容量 为 128KB。 而 今天 的 超级 计算 机 有 几 千 个 处 理 器 ， 能 够 寻 址 
几 TB 的 存储 器 ， 而 且 不 久 每 秒 就 能 执行 千 万 亿 条 指令 了 。 

什么 技术 将 标志 着 第 五 代 的 开始 ? 有 人 说 第 五 代 的 标志 是 接受 并 行 处 理 以 及 使 用 网 络 和 单 
用 户 工作 站 。 许 多 人 认为 我 们 已 经 跨 入 这 一 代 了 。 而 一 些 人 认为 它 将 是 量子 计算 。 一 些 人 把 第 
五 代 的 特点 描述 为 神经 网 络 、DNA 或 光 计 算 系 统 的 产生 。 在 我 们 进入 第 六 代 或 第 七 代 之 前 ， 
无 论 时 代 将 带 来 什么 ， 我 们 可 能 都 无 法 给 第 五 代 下 定义 。 
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集成 电路 及 其 生产 


在 我 们 周围 随处 可 以 发 现 集成 电路 一 从 计算 机 、 汽 车 到 冰箱 和 电话 。 最 先进 的 电路 在 指 
甲 大 小 的 面积 上 包含 数 亿 (甚至 数 十 亿 ) 个 元 器 件 。 在 这 些 先进 的 电路 中 ， 唱 体 管 的 太 寸 可 以 
小 到 45nm。 数 千 个 这 样 的 晶体 管 放 在 一 起 只 有 人 的 一 根 头 发 丝 的 截面 大 小 。 

如 何 制造 集成 电路 呢 ? 它们 是 在 半导体 生产 设备 中 制造 的 。 因 为 元 件 非常 小 ， 必 须 采 取 一 
切 预 防 措 施 以 确保 有 一 个 无 菌 、 无 颗粒 的 环境 ， 所 以 生产 是 在 “洁净 室 ” 中 进行 的 。 没 有 灰 
尘 ， 没 有 皮肤 细胞 ， 没 有 烟 甚 至 没有 细菌 。 工 作 人 员 必 须 穿 通常 称 为 “兔子 套装 ”的 洁净 服 ， 
确保 即使 是 最 微小 的 颗粒 也 不 能 进 到 空气 中 。 

这 个 过 程 从 芯片 设计 开始 ， 设 计 的 最 终结 果 是 形成 一 种 掩 模 ， 用 包含 电路 模式 的 模板 或 蓝 
图 表示 。 然 后 ， 在 硅 晶 片 表面 覆盖 氧化 物 绝缘 层 ， 紧 接着 覆盖 一 层 名 为 光 阻 材料 的 感光 膜 。 这 
种 光 阻 材料 被 紫外 光照 射 的 区 域 会 分 解 ， 没 被 照射 的 区 域 不 会 分 解 。 然 后 用 紫外 光 通 过 掩 模 昭 
射 硅 片 (这 一 过 程 称 为 光 刻 )。 紫 外 光照 射 光 阻 材料 后 剩 下 了 裸露 的 氧化 物 。 然 后 用 化 学 “ 蚀 
刻 ”(etching) 溶解 暴露 出 的 氧化 野 ， 并 且 要 去 除 没有 受到 紫外 光照 射 的 剩余 光 阻 材料 。“ 掺 
杂 ” 过 程 是 在 硅 中 嵌入 某 种 杂质 ， 改 变 未 保护 区 域 的 电 特 性 ， 这 样 基本 上 创建 了 晶体 管 。 然 后 
芯片 再 覆盖 一 层 绝 缘 氧 化 物 材料 和 一 层 光 阻 材料 ， 并 且 重 复 整个 过 程 几 百 次 ,每 重复 一 次 就 创 
建 了 芯片 的 新 的 一 层 。 用 相似 的 过 程 使 用 不 同 的 掩 模 可 创建 连接 芯片 上 元 件 的 导线 。 这 个 电路 
最 后 封装 在 保护 塑料 克 中 ， 经 测试 后 运 出 。 

随 着 元 件 变 得 越 来 越 小 ， 用 于 制造 它们 的 设备 必须 不 断 提高 质量 。 这 些 年 来 ,这 导致 了 制 
造 集成 电路 的 成 本 急剧 增加 。20 世纪 80 年 代 初 ， 建 立 一 个 半导体 工厂 的 成 本 大 约 是 1000 万 美 
元 。 到 20 世纪 80 年 代 后 期 ， 这 个 成 本 已 经 增加 到 大 约 2 亿美 元 。 到 20 世纪 90 年 代 后 期 ， 建 
立 一 个 集成 电路 制造 厂 的 成 本 大 约 在 10 亿美 元 。2005 年 ，Intel 为 了 一 个 制造 设备 花 了 大 约 20 
亿美 元 ，2007 年 为 了 使 3 个 工厂 能 够 生产 一 种 更 小 的 处 理 器 投资 了 大 约 70 亿美 元 来 更 换 设备 。 
2009 年 ，AMD 在 纽约 州 北部 开始 建立 一 个 投资 和 2 亿美 元 的 芯片 制造 设备 。 

制造 集成 电路 的 生产 设备 并 不 是 唯一 的 高 成 本 项 目 。 设 计 芯 片 和 创建 掩 模 的 成 本 从 100 万 
美元 到 300 万 美元 不 等 ， 越 小 的 芯片 成 本 越 高 ， 越 大 的 芯片 成 本 越 低 。 芯 片 的 设计 成 本 和 制造 
设备 成 本 那么 高 ， 而 我 们 却 可 以 用 大 约 100 美元 就 能 在 计算 机 商店 买 一 个 Intel 微 处 理 器 芯片 ， 
这 确实 太 让 人 惊讶 了 。 


1.5.6 摩尔 定律 


那么 哪里 是 终点 ? 晶体 管 能 制造 到 多 小 ? 封装 的 芯片 能 够 做 到 多 密集 ? 没 人 可 以 给 出 确定 
答案 。 每 年 科学 家 都 不 断 突破 预言 家 试图 设 定 的 集成 上 限 。 事 实 上 ， 当 Intel 公司 的 创始 人 戈 
登 . 摩尔 在 1965 年 表示 “在 一 个 集成 电路 中 晶体 管 的 密度 将 会 每 年 翻 一 番 ” 时 ， 就 有 一 些 人 
提出 质疑 。 这 个 预测 的 当前 版 本 通常 表达 为 “ 硅 忆 片 密度 每 18 个 月 翻 一 番 " 。 这 个 断言 称 为 摩 
尔 定律 (Moore' s Law) 。 摩 尔 认 为 这 个 假设 仅仅 能 够 维持 10 年 。 然 而 ， 世 片 制造 工艺 的 进步 使 
得 这 个 断言 持续 了 几 十 年 。 

然而 ， 若 使 用 当前 的 技术 ， 摩 尔 定律 不 能 够 永远 保持 。 物 理 方面 和 资金 方面 的 某 些 限制 最 
终 一 定 会 起 作用 。 按 照 目前 的 小 型 化 速度 ， 大 约 500 年 的 时 间 就 可 以 把 整个 太阳 系 放 在 一 个 芯 
片上 了 ! 显然 ,发 展 到 一 定 程 度 就 会 出 现 极 限 。 成 本 可 能 是 首要 的 约束 条 件 。 由 Intel 早期 的 
投资 人 阿 瑟 * 罗 克 提出 的 罗 克 定律 (Rock’ s Law) 是 摩尔 定律 的 一 个 推论 :“ 建 立 半导体 工厂 的 
主要 设备 的 成 本 每 四 年 翻 一 番 。” 罗 克 定 律 来 自 一 个 金融 家 的 观察 ， 他 看 到 新 的 芯片 制造 设备 
的 价格 从 1968 年 的 12 000 美元 逐步 增加 到 20 世纪 90 年 代 中 期 的 1200 万 美元 。2005 年 ， 建 设 
一 个 新 的 芯片 工厂 的 成 本 接近 30 亿美 元 。 按 照 这 个 速度 ， 到 2035 年 ， 一 个 存储 元 件 的 尺寸 将 
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会 小 于 一 个 原子 ， 而 且 将 需要 全 世界 的 财富 才能 建造 一 个 芯片 制造 三 。 所以， 即使 我 们 不 断 使 
芯片 变 得 更 小 、 更 快 ， 最 终 的 问题 也 可 能 是 我 们 能 否 负担 得 起 建设 工厂 的 费用 。 

当然 ， 如 果 维 持 摩 尔 定律 ， 那么 罗 克 定律 所 说 的 成 本 必须 下 降 。 显 然 ， 要 想 让 这 两 件 事 发 
生 ， 计算 机 必须 转向 一 种 完全 不 同 的 技术 。 在 过 去 的 5 年 里 , 一 直 都 有 关于 新 的 计算 范式 的 研 
究 。 围 绕 有 机 计算 、 超 导 、 分 子 物 理 和 量子 计算 提出 的 实验 室 原型 已 经 得 到 证 明 。 利 用 量子 力 
学 的 奇特 行为 解决 计算 问题 的 量子 计算 机 尤其 令 人 激动 。 不 仅 量子 系统 的 计算 速度 比 任何 以 前 
使 用 过 的 方法 都 快 ， 而 且 它们 也 将 革命 化 我 们 定义 计算 问题 的 方式 。 今 天 认为 是 荒 廖 不 可 行 的 
问题 ， 可 能 对 下 一 代 学 生 而 言 却 是 力所能及 的 好 问题 。 这 些 学 生 可 能 会 笑话 我 们 的 “原始 ” 
系统 ， 就 像 我 们 禁不住 要 笑话 ENIAC 一 样 。 


1.6 计算 机 层次 结构 

如 果 一 个 机 器 有 解决 各 种 各 样 问题 的 能 力 ， 那 么 它 必须 能 够 执行 用 不 同 语言 编写 的 程序 ， 
这 些 语言 包括 Fortran、C 、Lisp、Prolog 等 。 在 第 3 章 中 将 看 到 ， 与 我 们 一 起 工作 的 物理 元 件 仅 
有 导线 和 门 。 在 这 些 物理 元 件 和 高 级 语言 (如 C ++ ) 之 间 存 在 着 非常 大 的 开放 空间 一 一 语义 鸿 
沟 。 对 于 一 个 实用 系统 来 说 ， 其 绝 大 多 数 使 用 者 必须 看 不 到 这 个 语义 鸿沟 。 

程序 设计 经 验 告诉 我 们 ， 当 面 对 一 个 大 问题 时 ， 应 该 把 问题 分 解 开 并 使 用 “分 而 治之 ” 
的 方法 。 在 程序 设计 中 ,我 们 把 问题 划分 成 模块 ， 然 后 分 别 设计 每 一 个 模块 。 每 个 模块 执行 一 
个 特定 的 任务 ， 并 且 模 块 只 需要 知道 如 何 与 其 他 要 用 到 的 模块 进行 交互 。 

计算 机 系统 组 织 可 以 用 相似 的 方式 进行 处 理 。 通 过 抽象 原理 ， 我 们 可 以 把 机 器 的 建造 想象 
为 由 不 同 的 层次 结构 组 成 ， 每 一 层 都 有 一 个 特定 的 功能 并 且 作为 一 个 独立 的 假想 机 器 存在 。 我 
们 称 每 一 层 的 假想 计算 机 是 虚拟 机 。 每 一 层 的 虚拟 机 执行 自己 的 特殊 指令 集 ， 在 需要 的 时 候 要 
求 下 层 机 器 执行 任务 。 通 过 学 习 计算 机 组 织 ， 你 将 看 到 层次 结构 分 割 方法 背后 的 基本 原理 ， 以 
及 如 何 实现 层 和 层 之 间 的 接口 。 图 1-3 给 出 了 普遍 认可 的 描述 抽象 虚拟 机 的 层次 。 








图 1-3 现代 计算 系统 的 抽象 层次 
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第 6 层 为 用 户 层 ， 由 应 用 程序 组 成 ， 是 每 个 人 最 熟悉 的 层 。 在 这 一 层 ， 我 们 运行 程序 ， 如 
文字 处 理 器 、 图 形 软 件 包 或 游戏 等 。 从 用 户 层 几乎 看 不 到 下 面 的 那些 层 。 

第 5 层 为 高 级 语言 屋 ， 包 含 各 种 语言 ， 如 C、C ++ 、Fortran 、Lisp 、Pascal 和 Prolog。 必 须 
使 用 编译 器 或 解释 器 将 这 些 语言 翻译 成 机 器 可 以 理解 的 语言 。 编 译 后 的 语言 翻译 成 汇编 语言 ， 
然后 汇编 成 机 器 代码 。( 它 们 被 翻译 到 更 下 一 层 。) 在 这 一 层 ， 用 户 看 到 的 更 低层 的 内 容 非常 
少 。 即 使 程序 员 必 须知 道 数据 类 型 和 可 用 于 这 些 数据 类 型 的 指令 ， 也 不 需要 知道 这 些 类 型 实际 
上 是 如 何 实现 的 。 

第 4 层 为 汇编 语言 层 ， 包 含 某 种 汇编 语言 。 如 前 所 述 ， 编 译 过 的 高 级 语言 首先 翻译 为 汇编 
语言 ， 然 后 汇编 语言 直接 翻译 成 机 器 语言 。 这 种 一 对 一 的 翻译 意味 着 一 条 汇编 语言 指令 被 翻译 
成 一 条 机 器 语言 指令 。 通 过 分 层 , 减 小 了 高 级 语言 (例如 C++ ) 和 实际 机 器 语言 (由 0 和 1 组 
成 ) 之 间 的 语义 鸿沟 。 

第 3 层 为 系统 软件 层 ， 处 理 操作 系统 的 指令 。 这 一 层 负责 多 道 程序 、 存 储 器 保护 、 进 程 同 
步 ， 以 及 其 他 各 种 重要 的 功能 。 通 常 ， 将 汇编 语言 翻译 成 机 器 语言 的 指令 不 加 修改 地 通过 这 
一 层 。 
第 2 层 为 指令 集 架 构 (ISA ) 或 机 器 层 ， 由 计算 机 系统 中 特定 的 体系 结构 "认识 ”的 机 器 语言 
组 成 。 在 硬 连 线 计算 机 中 用 真实 机 器 语言 编写 的 程序 不 需 任 何 解释 器 、 翻 译 器 或 编译 器 就 能 够 
被 电路 直接 执行 。 我 们 将 在 第 4 章 和 第 5 章 中 深入 学 习 指 令 集 架构 。 

第 1 层 为 控制 层 ， 在 这 一 层 中 ， 控 制 单 元 要 确保 指令 正确 解码 和 执行 ， 确 保 数据 在 正确 的 
时 间 移 动 到 正确 的 地 方 。 控 制 单元 解释 从 上 层 传 递 给 它 的 机 器 指令 ， 一 次 解释 一 条 ， 触 发 需要 
的 活动 。 

设计 控制 单元 可 以 用 硬 连 线 方式 也 可 以 用 微 程序 方式 。 在 硬 连 线 方 式 中 ， 控 制 信号 来 自 数 
字 逮 辑 部 件 模块 。 这 些 信号 引导 所 有 数据 和 指令 传输 到 系统 的 合适 位 置 。 硬 连 线 控 制 单元 通常 
运行 得 非常 快 ， 因 为 它们 实际 上 是 物理 部 件 。 然 而 ， 由 于 同样 的 原因 ， 硬 连 线 控制 单元 修改 起 
来 非常 困难 。 

设计 控制 单元 的 另 一 种 选择 是 使 用 微 程序 执行 指令 。 微 程序 是 用 硬件 能 直接 执行 的 一 种 低 
级 语言 编写 的 程序 。 第 2 层 产 生 的 机 器 指令 被 送 入 微 程 序 ， 然 后 通过 激活 适合 执行 原始 指令 的 
硬件 解释 指令 。 一 条 机 器 层 指令 通常 翻译 成 多 条 微 代码 指令 。 这 种 翻译 不 同 于 汇编 语言 和 机 器 
语言 之 间 的 一 对 一 关系 。 微 程序 很 受 欢 迎 ， 因 为 它 修改 起 来 相对 容易 。 微 程序 设计 的 缺点 是 ， 
增加 的 翻译 层 通常 会 导致 指令 执行 速度 变 慢 。 

第 0 层 为 数字 逻辑 层 ， 在 这 一 层 中 ,我 们 能 够 找到 计算 机 系统 的 物理 元 件 : 门 和 导线 。 这 
是 制造 计算 机 系统 模块 和 实现 算术 逻辑 的 基础 。 第 3 章 将 详细 介绍 数字 逻辑 层 。 


1.7 云 计 算 : 计算 即 服务 

我 们 一 定 不 会 忘记 ， 每 个 计算 机 系统 的 最 终 目的 都 是 为 用 户 提供 功能 。 计 算 机 用 户 通常 不 
在 乎 百 万 兆 字 节 的 存储 和 千 兆 赫 的 处 理 器 速度 。 事 实 上 ,许多 公司 和 政府 机 构 已 经 完全 “摆脱 
了 技术 业务 ”"， 其 将 数据 中 心 外 包 给 第 三 方 专家 。 这 些 外 包 协 议 往往 高 度 复杂 并 且 要 规定 硬件 
配置 的 每 一 个 方面 。 除 了 详细 的 硬件 说 明 外 ， 服 务 级 别 协议 ( SLA ) 规 定 了 系统 性 能 和 可 用 性 的 
某 些 参数 不 符合 协议 要 求 的 罚 则 。 签 约 的 双方 都 要 雇 人 监督 合同 、 计 算账 单 以 及 在 需要 的 时 候 
按照 服务 级 别 协议 确定 惩罚 措施 。 由 于 有 额外 的 管理 开销 ， 因 此 对 于 那些 想 要 避免 技术 管理 问 
题 的 公司 来 说 ， 外 包 数 据 中心 既 不 廉价 ， 也 不 容易 。 

在 新 兴 的 云 计 算 领 域 ， 可 以 找到 一 种 比较 容易 的 方法 。 云 计算 是 因特网 提供 的 任何 类 型 的 
虚拟 计算 平台 的 总 称 。 云 计算 平台 由 它 提供 的 服务 而 不 是 它 的 物理 配置 来 定义 。 它 的 名 字 来 源 





于 象征 着 因特网 的 云图 标 , 但 是 这 个 隐喻 很 好 地 体现 了 云 基 础 设施 的 含义 ， 因 为 这 个 计算 机 比 
实际 更 抽象 “计算 机 ”和 “存储 ”作为 云 中 的 实体 呈现 给 用 户 , 但 是 通常 跨越 多 个 物理 服务 
器 。 存 储 通常 定位 到 磁盘 阵列 上 ， 而 磁盘 阵列 并 不 直接 连接 到 任何 特定 的 服务 器 上 。 系 统 软 件 
的 设计 使 这 种 配置 感觉 是 个 单一 系统 ， 因 此 我 们 说 它 给 用 户 提 供 了 一 个 虚拟 机 。 

云 计算 服务 可 以 用 基于 计算 机 层次 结构 的 多 种 方式 定义 和 交付 ， 如 图 1-4 所 示 。 在 层次 结 
构 的 顶部 ， 有 可 执行 的 程序 ， 云 服务 提供 商 可 以 在 因特网 上 提供 一 个 完整 的 应 用 ， 而 不 用 在 本 
地 安装 组 件 。 这 称 为 软件 即 服务 (SaaS) 。 这 个 服务 的 消费 者 不 用 维护 应 用 或 不 需要 以 任何 方 
式 关心 基础 设施 。Saas 应 用 往往 集中 于 有 限 的 非 关 键 性 业务 应 用 。 著 名 的 例子 包括 Gmail、 
Dropbox 、GoToMeeting 和 Netflix。 一 些 专门 的 产品 可 用 于 报税 准备 、 工 资 、 车 队 管 理 和 案例 管 
理 等 ， 这 仅仅 是 几 个 例子 。Salesforce. com 是 一 个 开创 性 的 、 功 能 齐全 的 、 用 于 提供 客户 关系 
管理 的 SaaS。 收 费 SaaS 通常 是 根据 用 户 数量 按 月 计 费 ， 有 时 也 加 上 每 笔 交 易 的 费用 。 





图 1-4 计算 即 服务 的 层次 


SaaS 的 一 个 最 大 缺点 是 消费 者 对 产品 的 行为 几乎 没有 控制 权 。 如 果 一 家 公司 为 了 使 用 
SaaS 产品 不 得 不 对 它 的 处 理 过 程 或 政策 进行 彻底 改变 的 话 ， 这 可 能 是 有 问题 的 。 当 公司 希望 对 
其 应 用 有 更 多 的 控制 权 ， 或 者 需要 的 应 用 不 能 使 用 SaaS 时 ， 可 能 会 选择 在 名 为 平台 即 服 务 
( PaaS ) 的 云 托 管 环境 中 部 署 自己 的 应 用 。Paas 提供 服务 器 硬件 、 操 作 系 统 、 数 据 库 服务 、 安 
全 组 件 和 备份 与 恢复 服务 。PaaS 服务 提供 商 管理 性 能 和 环境 的 可 用 性 ， 而 客户 管理 在 Paas 云 
上 托管 的 应 用 。 客 户 通常 是 每 月 按照 兆 字 节 存储 、 处 理 器 的 利用 率 和 兆 字 节 数据 传输 付费 。 著 
名 的 Paas 提供 商 有 Google App Engine 和 Microsoft Windows Azure Cloud Services( 以 及 Force. com 
(由 Salesforce. com 提供 的 PaaS) ) 。 

Paas 不 适合 于 需要 配置 快速 变化 的 情况 。 主 要 业务 是 软件 开发 的 公司 就 是 这 种 情况 。 要 
改变 运营 良好 的 PaaS 业务 ， 需 要 正式 的 变更 过 程 ， 这 阻碍 了 快速 软件 部 署 (迫使 公司 按照 服务 
提供 商 的 规则 行事 ) 。 事 实 上 ， 在 员工 能 够 管理 操作 系统 和 数据 库 软 件 的 公司 ， 选 择 名 为 基础 
设施 即 服务 或 (laaS ) 的 云 模型 可 能 是 最 好 的 。Iaas 是 最 基本 的 云 服 务 模 型 ， 仅 提供 服务 器 硬 
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件 、 服 务 器 安全 访问 和 备份 与 恢复 服务 。 客 户 负 责 所 有 的 系统 软件 ， 包 括 操作 系统 和 数据 库 。 
IaaS 通常 按照 使 用 的 虚拟 机 数量 、 兆 字 节 存储 和 兆 字 节 数据 传输 付费 ， 但 是 费 率 比 Paas 低 一 
些 。 最 知名 的 IaaS 公司 包括 Amazon EC2 、Google Compute Engine 、Microsoft Azure Services Plat- 
form 、Rackspace 和 HP Cloud 。 

PaaS 和 IaaS 不 仅 解决 了 数据 中 心 管理 的 困难 ， 而 且 提 供 了 基于 需求 增加 和 删除 资源 的 能 
力 ， 这 种 能 力 称 为 弹性 。 客 户 只 为 需要 的 基础 设施 付费 。 所 以 ， 如 果 一 家 企业 的 业务 有 旺季 ， 
那么 仅 需要 在 旺季 持续 期 间 部 署 额外 的 能 力 。 当 一 家 公司 在 计算 需求 方面 有 大 的 变化 时 ， 这 种 
灵活 性 能 够 给 公司 节省 一 大 笔 钱 。 

云 存 储 是 Iaas 的 一 种 受 限 类 型 。 公 众 通过 Dropbox、Google Drive 和 Amazon. com 上 的 Cloud 
Drive( 这 里 仅 列 出 众多 提供 商 中 的 几 个 ) 可 以 便宜 地 获得 少量 云 存 储 。 和 谷歌 、 亚 马 逊 、 惠 普 、 
IBM 和 微软 是 为 企业 提供 云 存储 的 供应 商 。 与 云 计 算 一 样 ， 企 业 级 云 存 储 通常 也 需要 仔细 管理 
性 能 和 可 用 性 。 

所 有 潜在 的 云 计 算 客户 必须 问 自 己 的 问题 是 : 维护 自己 的 数据 中 心 便宜 ， 还 是 购买 云 服 务 
(包括 峰值 期 间 增加 的 费用 ) 便 宜 ? 此 外 ， 如 同 传统 的 外 包 一 样 ， 供 应 商 提 供 的 云 计算 也 涉及 相当 
多 的 合同 谈判 和 管理 。 在 服务 提供 商 和 服务 消费 者 之 间 的 关系 中 ，SLA 管理 仍然 是 重要 的 活动 。 
此 外 ,一 旦 企业 将 其 资产 转移 到 云 上 ， 就 可 能 很 难 再 转变 回 公司 拥有 的 数据 中 心中 ， 而 这 种 需求 
有 可 能 出 现 。 因 此 ， 任 何 将 资产 转移 到 云 的 打算 必须 仔细 考虑 ， 并 清楚 地 了 解 风险 。 

云 计算 对 计算 机 科学 家 也 提出 了 许多 挑战 。 首 先 并 且 最 重要 的 是 数据 中 心 的 技术 配置 。 基 
础 设施 必须 提供 不 间断 服务 ， 甚 至 在 维护 期 间 。 它 必须 能 方便 地 配置 到 需要 的 地 方 ， 而 不 降低 
或 中 断 服 务 。 基 础 设施 的 性 能 必须 仔细 监测 ， 并 且 当 性 能 下 降 到 某 一 设 定 的 靖 值 时 就 采取 干预 
措施 ， 否 则 可 能 引起 SLA 罚款 。 

在 云 计算 的 消费 者 一 方 ， 软 件 架构 师 和 程序 员 必 须 注 意 资源 消耗 ， 因 为 云 计 算 模 式 的 收费 
与 资源 消耗 成 比例 。 这 些 资源 包括 通信 带宽 、 处 理 器 周期 和 存储 。 因 此 ， 为 了 省 钱 ， 应 用 程序 
应 该 设计 成 减少 网 络 上 的 数据 传输 、 节 约 机 器 周期 并 把 存储 字 节 数 减 到 最 少 。 在 把 程序 部 署 到 
云 中 之 前 ， 至 关 重 要 的 是 对 程序 进行 非常 细致 的 测试 : 比如 ， 在 一 个 无 限 循 环 中 消耗 资源 的 错 
误 模块 可 能 导致 月 底 “惊人 的 ” 云 账 单 。 

随 着 数据 中 心 的 成 本 和 复杂 性 持续 上 升 ( 这 看 不 到 尽头 ) ， 云 计算 肯定 会 成 为 中 小 企业 的 
选择 平台 。 但 是 云 计算 并 不 是 无 忧 无 虑 的 。 一 个 公司 可 能 没有 了 技术 挑战 ,但 又 会 面临 更 令 人 
苗 恼 的 供应 商 管理 挑战 。 


1.8 冯 .… 诺 依 曼 模型 


在 最 早 的 电子 计算 机 器 中 ,程序 设计 与 把 电线 连接 到 插头 是 同义词 。 不 存在 分 层 体系 结 
构 ， 所 以 即使 给 计算 机 设计 一 个 非常 简单 的 程序 也 非常 麻烦 。 在 ENIAC 的 研制 工作 完成 之 前 ， 
莫 克 利和 艾 克 特 构思 了 一 种 改变 他 们 的 计算 机 器 行为 的 更 简单 的 方法 。 他 们 认为 用 水 银 延 迟 线 
作为 存储 设备 可 以 存储 程序 指令 。 这 样 ， 在 编写 新 程序 或 者 调试 老 程序 时 ， 就 可 以 不 用 做 单调 
的 系统 重新 连 线 的 工作 了 。 莫 克利 和 艾 克 特 记 录 了 他 们 的 想法 ， 提 出 把 这 种 想法 作为 下 一 个 计 
算 机 EDVAC 的 基础 。 不 幸 的 是 ， 当 时 他 们 参与 的 ENIAC 项 目 在 第 二 次 世界 大 战 期 间 是 绝密 项 
目 ， 莫 克利 和 艾 克 特 不 能 立即 发 表 他 们 的 见解 。 

然而 ， 许 多 在 ENIAC 项 目 外 围 工作 的 人 不 受 限 制 。 其 中 一 个 人 就 是 著名 的 匈牙利 数学 家 
约翰 冯 … 诺 依 曼 。 在 阅读 了 莫 克 利和 艾 克 特 为 EDVAC 提出 的 想法 后 ， 冯 “' 诺 依 曼 公开 发 表 
了 这 个 想法 。 他 非常 有 效 地 传递 了 这 个 概念 ， 因 此 历史 把 这 项 发 明 归功 于 他 。 所 有 存储 程序 的 
计算 机 都 使 用 名 为 汉 “' 诺 依 曼 架构 的 冯 “' 诺 依 曼 系 统 。 虽 然 我 们 只 能 按照 传统 说 存储 程序 的 计 





算 机 使 用 的 是 冯 … 诺 依 曼 架 构 ， 但 我 们 还 是 应 该 对 莫 克 利和 艾 克 特 这 两 位 真正 的 发 明 者 表达 应 
有 的 敬意 。 
今天 的 存储 程序 的 计算 机 架构 至 少 具有 以 下 特点 : 
e 由 三 部 分 硬件 系统 组 成 : 一 个 带 有 控制 单元 、 算 术 逻 辑 单 元 (ALU) 、 寄 存 器 (小 的 存储 
区 ) 和 程序 计数 器 的 中 央 处 理 单 元 (CPU) ; 一 个 主 存储 器 系统 ， 其 中 存储 着 控制 计算 机 
操作 的 程序 ; 一 个 I/O 系统 。 

e 执行 顺序 指令 处 理 的 能 力 。 

e 在 主 存储 器 系统 和 CPU 的 控制 单元 之 间 包 含 一 条 单一 路 径 ， 它 既 可 以 是 物理 上 的 也 可 

以 是 逻辑 上 的 ， 强 制 交替 指令 周 gET AS 
期 和 执行 周期 。 这 个 单一 路 径 通 
常 称 为 汉 ' 诺 依 曼 瓶 颈 。 

图 1-5 显示 了 这 些 特点 如 何 汇集 在 
现代 计算 机 系统 中 。 请 注意 ， 图 中 所 示 
的 系统 通过 算术 逻辑 单元 传送 所 有 LO 
(实际 上 是 通过 累加 器 传送 的 ， 累 加 器 
是 ALU 的 组 成 部 分 ) 。 这 种 架构 在 冯 ， 
诺 依 曼 执行 周期 中 运行 程序 。 冯 ， 诺 依 
曼 执 行 周期 (也 称 为 取 指 - 译 码 -执行 
周期 ) 描 述 了 机 器 的 工作 过 程 。 一 个 执 
行 周期 的 操作 如 下 所 示 : 

1. 控制 单元 从 存储 器 中 取 下 一 条 程 
序 指令 ， 使 用 程序 计数 器 确定 指令 所 在 
的 位 置 。 
ee 图 1.5 汉 . 诺 依 昌 架 构 

3. 从 存储 器 中 取出 执行 这 条 指令 所 需要 的 任何 操作 数 ， 并 且 放 到 CPU 的 寄存 器 中 。 

4. ALU 执行 这 条 指令 并 且 把 结果 放 到 寄存 器 或 存储 絮 中 。 

冯 … 诺 依 曼 架 构 中 的 一 些 概念 已 经 扩展 了 ， 以 便 存储 在 访问 速度 慢 的 存储 介质 (如 硬盘 ) 
中 的 程序 和 数据 可 以 在 程序 执行 之 前 复制 到 访问 速度 快 的 易 失 性 存储 介质 (如 RAM) 中。 这 种 
架构 也 简化 为 系统 总 线 模型 ， 如 图 1-6 所 示 。 数 据 总 线 把 数据 从 主 存储 器 移动 到 CPU 寄存 器 





(反之 亦 然 ) 。 地 址 总 线 保存 着 数据 总 线 正 在 访问 的 数据 的 地 址 。 控 制 总 线 传 送 的 是 在 信息 传 
输 时 必要 的 控制 信号 。 
CPU 
(ALU、 存储 器 输入 和 输出 
寄存 器 和 控制 ) 





控制 总 线 
图 1-6 修改 后 的 汉 : 诺 依 曼 架构 ， 增 加 了 系统 总 线 





冯 “' 诺 依 曼 架构 的 其 他 增强 方法 包括 使 用 索引 寄存 器 寻 址 、 增 加 浮 点 数据 、 使 用 中 断 和 腊 
步 Y0O、 增 加 虚拟 存储 器 以 及 增加 通用 寄存 器 。 在 后 面 的 章节 中 你 将 学 习 很 多 增强 方法 。 





计算 机 的 量子 飞跃 : ”我 们 能 做 到 多 小 ? 


超大 规模 集成 电路 技术 已 经 可 以 在 一 个 芯片 上 放置 几 十 亿 个 晶体 管 ， 但 是 用 现在 的 晶体管 
技术 制造 的 晶体 管 在 尺寸 上 有 一 个 限度 。 新 南 威 尔 士 大 学 的 量子 计算 机 技术 中 心 和 威斯康星 大 
学 麦迪 撑 分 校 的 研究 人 员 已 经 把 “小 ”做 到 了 全 新 的 水 平 。2010 年 5 月， 他 们 宣布 了 7- 原 子 
晶体 管 ， 即 一 个 内 入 在 仅 有 7 个 原子 大 小 的 硅 中 的 工作 晶体 管 。 虽 然 旱 在 2002 年 允许 电子 流 
动 的 1 个 原子 大 小 的 晶体 管 就 被 报道 过 ， 但 是 ， 这 个 7- 原 子 晶 体 管 有 所 不 同 ， 它 提供 了 今天 所 
知道 的 晶体 管 的 全 部 功能 。 

这 个 7- 原 子 晶 体 管 是 由 人 使 用 扫描 隧道 显微镜 手工 创建 的 ， 距 离 大 规模 生产 还 有 很 长 的 路 
要 走 ， 但 是 研究 者 希望 尽快 使 其 商业 化 。 晶 体 管 的 微小 尺寸 意味 着 更 小 但 更 强大 的 计算 机 。 专 
家 估计 它 可 以 把 微 晶 片 缩小 1X100， 而 使 处 理性 能 呈 指 数 提高 。 这 意味 着 计算 机 将 变 小 1X100， 
同时 快 100 倍 。 

除了 替换 传统 的 晶体 管 外 ， 这 一 发 现 可 能 成 为 努力 在 硅 片 上 建造 量子 计算 机 的 基础 。 量 子 
计算 被 认为 是 计算 机 技术 的 下 一 个 重大 飞跃 。 现 在 已 经 研制 出 来 的 小 的 量子 计算 机 的 运算 速度 
比 传统 计算 机 快 几 百 万 倍 ， 但 这 些 计 算 机 太 小 ， 没 有 多 大 用 处 。 一 个 可 以 工作 的 大 型 量子 计算 
机 将 使 我 们 能 够 计算 和 解决 那些 用 传统 计算 机 需要 花费 130 多 亿 年 才能 解决 的 问题 。 这 可 能 会 
改变 我 们 看 世界 的 方式 。 一 方面 ， 面 对 这 种 计算 能 力 ， 现 在 使 用 的 各 种 加 密 算法 都 将 毫 无 用 
处 。 另 一 方面 ， 使 用 新 型 量子 技术 有 可 能 实现 超 安全 通信 。 

量子 计算 机 有 很 大 潜力 。 如 果 使 用 量子 计算 ,那么 现 有 的 应 用 程序 会 有 巨大 的 性 能 提升 ， 
这 些 应 用 包括 电影 特效 、 密 码 学 、 搜 索 大 量 数据 文件 、 大 数 因 式 分 解 、 模 拟 各 种 系统 (如 核 爆 
炸 和 天 气 模式 ) 、 军 事 和 情报 收集 以 及 密集 且 耗 时 的 计算 (如 天 文学 、 物 理学 和 化 学 中 的 发 现 ) 
等 ， 也 可 能 演化 出 我 们 还 没有 发 现 的 新 应 用 。 

除了 我 们 已 经 了 解 的 计算 方面 的 潜能 外 ， 还 有 另外 一 个 原因 使 新 的 7- 原 子 晶 体 管 具有 重大 意 
义 。 回 顾 摩尔 定律 ， 这 个 定律 并 不 是 自然 法 则 ， 而 是 对 芯片 设计 的 创新 和 驱动 力 的 期 待 。 自 1965 
年 以 来 ， 摩 尔 定律 一 直 适 用 ， 但 为 了 做 到 这 一 点 ， 芯 片 制造 商 已 经 从 一 个 技术 跳 转 到 另 一 个 技 - 
术 。 戈 登 . 摩尔 已 经 预测 ， 如 果 仅 限于 CMOS 硅 ， 他 的 定律 将 在 2020 年 左右 失效 。 这 个 7- 原 子 晶 
体 管 的 发 现 ， 赋 予 了 摩尔 定律 新 的 生命 。 然 而 ,著名 的 物理 学 家 史蒂芬 * 霍金 解 释 说 ， 芯 片 制造 
商 在 “强化 ”摩尔 定律 时 受到 两 个 基本 的 制约 ; 光速 和 物质 的 原子 本 质 。 这 意味 着 无 论 使 用 什么 
技术 ， 摩 尔 定律 终 将 失效 。 


1.9 非 汉 … 诺 依 曼 模型 

直到 现在 ， 几 乎 所 有 通用 计算 机 都 遵从 冯 … 诺 依 曼 的 设计 。 也 就 是 说 ， 具 有 由 CPU、 存 储 
器 和 IO 设备 组 成 的 架构 ， 把 指令 和 数据 放 在 一 个 存储 器 中 ， 取 指令 和 传送 数据 使 用 一 个 总 
线 。 汉 . 诺 依 曼 计 算 机 顺序 执行 指令 ， 因 此 非常 适合 顺序 处 理 。 然 而 ， 汉 ' 诺 依 曼 瓶颈 一 直 阻 
碍 着 工程 师 寻 找 建造 价格 便宜 且 兼 容 大 量 商用 软件 的 快速 系统 的 方法 。 

工程 师 可 以 使 用 多 种 不 同 的 计算 模型 ， 不 需要 受 与 汉 ' 诺 依 曼 系统 兼容 的 约束 。 非 汉 . 诺 
依 曼 架 构 是 指 计算 模 型 与 汉 ' 诺 依 曼 架 构 的 特征 不 符 。 例 如 ， 一 种 架构 不 把 程序 和 数据 存储 在 
存储 器 中 或 者 不 按 顺 序 处 理 程序 ， 这 就 看 作 一 种 非 汉 ' 诺 依 曼 机 器 。 一 个 计算 机 有 两 根 总 线 ， 
一 根 用 于 数据 ， 另 一 根 用 于 指令 ， 也 被 认为 是 一 种 非 汉 . 诺 依 曼 机 器 。 使 用 哈佛 架构 设计 的 计 
算 机 有 两 根 总 线 ， 人 允许 同时 传送 数据 和 指令 ， 而 且 具 有 数据 和 指令 分 开 存储 的 存储 器 。 许 多 现 
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代 通 用 计算 机 使 用 的 是 修改 版 的 哈佛 架构 ， 它 们 有 分 开 的 数据 通路 和 指令 通路 ,但 是 数据 和 指 
令 没 有 分 开 存 储 。 纯 哈佛 架构 通常 用 于 微 控制 器 (整个 计算 机 系统 在 一 个 芯片 上 ) ， 比 如 用 于 
家 电 、 玩 具 和 汽车 中 的 让 人 式 系统 。 

很 多 非 冯 “' 诺 依 曼 机 器 是 为 特殊 目的 设计 的 。 公 认 的 第 一 个 非 汉 : 诺 依 曼 处 理 芯 片 完全 是 
为 图 像 处 理 设计 的 。 另 一 个 例子 是 归 约 机 ( 它 使 用 图 归 约 执行 组 合 逻辑 计算 ) 。 其 他 非 汉 “' 诺 
依 曼 计算 机 包括 数字 信号 处 理 器 ( DSP) 和 媒体 处 理 器 ， 它 们 能 够 执行 一 条 指令 处 理 一 组 数据 
(而 不 是 执行 一 条 指令 处 理 一 个 数据 ) 。 

许多 不 同 的 分 支 领域 属于 非 汉 : 诺 依 曼 范畴 ， 包括: 在 硅 上 实现 的 神经 网 络 ( 它 使 用 来 自 于 
大 脑 模型 的 想法 作为 计算 范式 ) ， 细 胞 自动 机 ， 认 知 计算 机 (通过 经 验 来 学 习 而 不 是 通过 程序 学 习 
的 机 器 ， 包 括 IBM 的 人 脑 模型 机 SyNAPSE 计算 机 ) ， 量 子 计算 (计算 和 量子 物理 学 的 结合 ) ， 数 据 
流 计算 ， 并 行 计算 机 。 这 些 系 统 有 共同 之 处 一 一 计算 分 布 在 可 以 并 行 执行 的 不 同 处 理 单元 上 。 它 
们 的 不 同 之 处 在 于 各 种 组 件 之 间 连 接 的 强 弱 。 其 中 ， 并 行 计算 是 目前 最 流行 的 。 


1. 10 ”并 行 处 理 器 和 并 行 计算 

今天 ， 并行 处 理解 决 了 许多 大 问题 ， 所 用 的 方法 与 美国 西部 移民 并 排 使 用 多 头 牛 解决 大 问 
题 的 方法 差不多 。 如 果 他 们 使 用 一 头 牛 移动 一 棵 树 ， 这 头 牛 不 够 大 或 不 够 强壮 ， 他 们 绝对 不 会 
尝试 养 一 头 更 大 的 牛 ， 而 是 使 用 两 头 牛 。 如 果 我 们 的 计算 机 不 够 快 或 不 够 强 ， 那 么 为 什么 不 简 
单 地 使 用 多 个 计算 机 替代 开发 一 台 更 快 、 更 强 的 计算 机 呢 ? 这 正 是 并 行 计 算 所 要 做 的 。 第 一 个 
并 行 处 理 系统 建造 于 20 世纪 60 年 代 后 期 ， 仅 有 两 个 处 理 器 。20 世纪 70 年 代 已 经 有 32 个 处 理 
器 的 超级 计算 机 的 介绍 ，20 世纪 80 年 代 产 生 了 第 一 个 有 1000 多 个 处 理 器 的 系统 。1999 年 ， 
IBM 宣布 为 开发 一 个 名 为 蓝 色 基因 系列 的 超级 计算 机 架构 提供 资金 。 蓝 色 基 因 /L 是 这 个 系列 
中 的 第 一 台 计 算 机 ， 是 一 个 大 规模 并 行 计算 机 ， 包 含 131 000 个 双核 处 理 器 ， 每 个 处 理 器 有 自 
己 专用 的 存储 器 。 除 了 允许 研究 人 员 研 究 蛋 白质 折 秋 的 行为 (通过 使 用 大 量 的 模拟 ) 外， 这 台 
计算 机 还 允许 研究 人 员 在 并 行 架构 和 并 行 架 构 软 件 方面 探索 新 的 想法 。IBM 持续 不 断 地 为 这 个 
系列 开发 计算 机 。2007 年 发 布 了 蓝 色 基因 /P， 它 有 四 核 处 理 器 。 蓝 色 基 因 /Q 是 这 个 系列 中 最 
新 设计 的 计算 机 ， 使 用 16 核 处 理 器 ， 每 个 机 架 有 1024 个 计算 节点 ， 可 扩展 到 512 个 机 架 。 
Nostromo( 在 波兰 用 于 生物 医学 数据 ) 、Sequoia( 在 劳伦斯 利 弗 莫 尔 国家 实验 室 用 于 核 模拟 和 科 
学 研究 ) 和 Mira( 用 在 阿 贡 国 家 实验 室 ) 等 处 安装 了 蓝 色 基 因 /Q 计算 机 。 

双核 和 四 核 处 理 器 (以 及 更 多 核 的 处 理 器 ， 就 像 我 们 在 蓝 色 基 因 /Q 中 看 到 的 ) 是 多 核 处 理 
器 。 但 是 ， 什 么 是 多 核 处 理 器 呢 ? 从 本 质 上 讲 ， 它 是 一 种 特殊 类 型 的 并 行 处 理 器 。 并 行 处 理 器 
通常 划分 为 “共享 存储 器 ”处 理 器 (其 中 处 理 器 共享 相同 的 全 局 存储 器 ) 或 “分 布 式 存储 器 ” 
计算 机 (其 中 每 个 处 理 器 都 有 自己 私有 的 存储 器 ) 。 第 9 章 将 详细 介绍 并 行 处 理 器 。 以 下 讨论 仅 
限于 个 人 计算 机 中 使 用 的 共享 内 存 多 核 架 构 。 

多 核 架 构 是 允许 多 个 处 理 单元 (通常 称 为 核 ) 位 于 一 个 芯片 上 的 并 行 处 理 器 。 双 核 (dual core) 
意味 着 有 2 个 核 ， 四 核 ( quad core ) 意味 着 有 4 个 核 ， 等 等 。 但 是 ， 什 么 是 核 ? 在 集成 电路 中 “ 插 
人 ”多 个 独立 的 核 (就 像 典 型 的 冯 … 诺 依 曼 机 ) 并 且 并 行 运 行 ， 而 不 是 一 个 处 理 单元 。 每 个 处 理 单 
元 都 有 自己 的 ALU 和 寄存 器 组 ， 但 所 有 处 理 器 共享 内 存 和 一 些 其 他 资源 。“ 双 核 ” 不 同 于 “ 双 处 
理 器 ” 。 双 处 理 器 机 器 有 两 个 处 理 器 ， 但 是 每 个 处 理 器 搬 在 各 自 的 主板 上 。 要 注意 的 重要 区 别 是 ， 
在 多 核 机 器 中 所 有 的 核 都 集成 到 同一 个 芯片 中 。 这 意味 着 你 可 以 用 一 个 双核 处 理 器 ( 条件 是 你 的 
计算 机 有 适合 新 芯片 的 搬 槽 ) 芯片 替换 计算 机 中 的 单 核 ( 单 处 理 器 ) 芯片。 今天 许多 计算 机 宣称 为 
双核 、 四 核 或 更 多 的 核 。 双 核 通常 被 认为 是 当今 计算 机 的 标准 。 大 多 数 台 式 机 和 笔记 本 电脑 的 核 
是 有 限 的 ( 少 于 8) ， 当 然 ， 也 可 以 用 合适 的 价格 买 到 有 几 百 个 核 的 机 器 。 
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尽管 你 的 计算 机 可 以 有 多 个 核 ， 但 这 并 不 意味 着 它 会 更 快 地 运行 你 的 程序 。 编 写 的 应 用 程 
序 (包括 操作 系统 ) 必 须 利用 多 个 处 理 单元 (这 一 般 适用 于 并 行 处 理 )。 多 核 计算 机 对 于 多 任务 
处 理 非 常 有 用 ， 即 当 用 户 一 次 做 多 件 事情 时 。 例 如 ， 你 可 能 同时 在 阅读 电子 邮件 、 听 音乐 、 浏 
览 网 页 和 刻录 DVD。 在 操作 系统 能 够 同时 处 理 许 多 任务 的 条 件 下 ， 这 些 “ 多 任务 ”可 以 被 分 
配 到 不 同 的 处 理 器 上 并 且 并 行 执行 。 

除了 多 任务 处 理 ， 多 线程 也 能 增加 任何 有 内 在 并 行 性 的 应 用 程序 的 性 能 。 程 序 被 划分 成 线 
程 ， 可 以 把 线程 想象 成 微小 的 进程 。 例 如 ， 一 个 网 页 浏览 器 是 多 线程 的 ， 一 个 线程 可 以 下 载 文 
本 ， 而 每 个 图 像 都 由 不 同 的 线程 控制 和 下 载 。 如 果 一 个 应 用 程序 是 多 线程 的 ， 那 么 不 同 的 线程 
可 以 在 不 同 的 处 理 单元 上 并 行 运行 。 我 们 应 该 注意 ， 即 使 在 单 处 理 器 上 ， 多 线程 也 能 改善 性 
能 ， 但 是 这 个 话题 最 好 留 到 以 后 讨论 。 更 多 的 信息 见 参 考 文献 Stallings(2012 ) 。 

概括 地 说 ， 并 行 处 理 涉及 多 种 不 同 的 架构 ， 从 多 个 独立 的 计算 机 一 起 工作 ， 到 多 个 处 理 右 共 
享 存储 器 ， 再 到 多 个 核 集 成 到 同一 个 芯片 上 。 由 于 并 行 处 理 器 不 是 顺序 处 理 指令 ， 所 以 在 技术 上 
没有 归 类 为 汉 “' 诺 依 曼 机 。 然 而 ， 许 多 人 认为 并 行 处 理 计 算 机 包含 CPU， 使 用 程序 计数 器 ， 并 且 
程序 和 数据 都 存储 在 主 存 中 ， 这 使 得 它们 更 像 是 对 冯 “ 诺 依 曼 架 构 的 扩展 ， 而 不 是 背离 它 ， 所 以 
这 些 人 把 并 行 处 理 计算 机 看 作 一 组 冯 ' 诺 依 曼 机 通力 合作 。 在 这 种 观点 中 ， 也 许 说 并 行 处 理 显示 
了 “ 非 汉 ' 诺 依 曼 特性 ”更 恰当 。 无 论 并 行 处 理 器 如 何 分 类 ， 并 行 计算 都 可 以 让 我 们 用 多 任务 的 
方式 解决 更 大 、 更 复杂 的 问题 ， 并 在 各 种 软件 工具 和 程序 设计 中 驱动 着 新 的 研究 。 

然而 ， 并 行 计 算 也 有 其 局 限 性 。 随 着 处 理 器 数量 的 增加 ， 把 任务 分 布 到 处 理 器 上 的 管理 开 
销 也 会 随 之 增加 。 一 些 并 行 处 理 系统 需要 额外 的 处 理 器 来 管理 其 余 的 处 理 器 和 分 配 的 资源 。 无 
论 我 们 在 系统 中 放置 多 少 个 处 理 器 ， 或 者 分 配给 它们 多 少 资源 ， 一 定 都 会 因为 某 种 原因 在 某 个 
地 方形 成 瓶颈 。 然 而 ， 我 们 能 做 的 最 好 的 事情 是 确保 系统 中 最 慢 的 部 分 是 使 用 最 少 的 部 分 。 这 
是 后 面 要 介绍 的 阿 姆 达 尔 定 律 (Amdahl s Law) 所 描述 的 观点 。 这 个 定律 描述 为 : 如 果 性 能 的 增 
强 与 一 个 改进 的 特征 有 关 ， 那 么 性 能 增强 的 量 受 到 这 个 改进 特征 使 用 量 的 限制 。 基 本 的 前 提 是 
每 个 算法 都 有 串 行 部 分 ， 而 串 行 部 分 会 限制 用 多 处 理 器 执行 算法 获得 的 加 速 。 

如 果 并 行 机 和 其 他 非 汉 : 诺 依 曼 架构 给 处 理 速度 和 性 能 带 来 了 如 此 巨大 的 增长 ， 为 什么 不 
是 每 个 人 随时 都 使 用 它们 呢 ? 答案 在 于 它们 的 可 编程 性 。 在 操作 系统 中 能 够 利用 多 个 核 的 技术 
进步 ， 已 经 使 这 些 芯 片 用 到 了 我 们 今天 可 以 买 到 的 台式 机 和 笔记 本 电脑 中 。 然 而 ， 真 正 的 多 处 
理 器 编程 比 单 处 理 器 和 多 核 处 理 器 的 编程 更 加 复杂 ， 要 求人 们 以 不 同 的 方式 思考 问题 ， 要 采用 
新 的 算法 和 编程 工具 。 

这 些 编程 工具 之 一 是 一 组 新 的 程序 设计 语言 。 我 们 的 程序 设计 语言 大 多 是 为 汉 . 诺 依 曼 架 
构 创建 的 色 ， 诺 依 曼 语言 。 许 多 通用 语言 已 经 用 特殊 的 库 扩 展 为 适用 于 并 行程 序 设计 ， 而 且 专 
门 为 并 行 编程 环境 设计 了 许多 新 的 语言 。 适 用 于 其 余 类 型 的 ( 非 并 行 ) 非 冯 “' 诺 依 曼 平台 的 程 
序 设计 语言 非常 少 ， 而 且 真 正 了 解 如 何在 这 些 环 境 中 有 效 地 编写 程序 的 人 很 少 。 非 汉 ， 诺 依 晶 
语言 的 例子 包括 为 数据 流 机 使 用 的 Lucid 语言 、 为 量子 计算 机 使 用 的 量子 计算 语言 (QCL)， 以 
及 用 于 FPGA 编程 的 VHDL 或 Verilog 语言 。 我 们 在 下 一 节 中 会 看 到 ， 即 使 在 并 行 机 编程 中 存在 
固有 的 困难 ， 这 个 领域 也 正在 取得 重大 进展 。 


1. 11 并 行 性 : 机 器 智能 的 推动 者 一 一 深蓝 和 沃 森 

从 我 们 介绍 过 的 “土耳其 机 械 人 ”可 以 明显 看 到 ， 下 棋 一 直 被 认为 是 “会 思考 的 机 器 ” 
的 最 有 力 证 明 。 棋 盘 是 在 基本 平等 的 条 件 下 人 类 和 机 器 能 够 相遇 的 一 个 战场 ， 当 然 ， 人 类 总 是 
有 优势 的 。 自 20 世纪 50 年 代 末 以 来 ,已 经 有 了 真正 的 下 国际 象棋 的 计算 机 。 在 过 去 的 几 十 年 
里 ， 它 的 硬件 和 软件 都 在 逐渐 改进 ， 最 终 成 为 技术 熟练 棋 手 的 强大 对 手 。 下 棋 冠军 的 问题 一 直 














被 认为 太 难 了 ， 很 多 人 认为 机 器 永远 不 会 战胜 人 类 大 师 。1997 年 5 月 11 日 ,一 台 叫 作 深 蓝 
(Deep Blue ) 的 机 器 战胜 了 人 类 大 师 。 

深蓝 的 主 设计 师 是 IBM 的 研究 人 员 许 峰 雄 、 托 马 斯 * 阿南 塔 拉 曼 和 英里 : 坎贝尔 。 据 报 
道 ， 深 蓝 耗资 超过 600 万 美元 ， 并 花 了 6 年 时 间 建 造 完成 。 深 蓝 是 一 个 大 规模 并 行 系统 ， 由 30 
台 基 于 RS/6000 的 节点 辅 以 480 个 国际 象棋 专用 芯片 组 成 。 深 蓝 有 一 个 独立 于 开局 和 残局 系统 
的 完整 棋局 数据 库 ， 数 据 库 中 存储 了 700 000 个 完整 的 棋局 。 它 平均 每 秒 分 析 2 亿 个 棋 位 ， 这 
使 深蓝 能 向 前 看 12 步 棋 。 

由 于 国际 象棋 冠军 加 里 卡 斯 帕 罗 夫 完 胜 过 较 早 版 本 的 深蓝 ， 所 以 卡 斯 帕 罗 夫 被 普遍 看 好 
会 赢得 1997 年 5 月 3 日 开始 的 复赛 。 在 五 场 比赛 结束 后 ， 卡 斯 帕 罗 夫 和 深蓝 战 成 平局 ， 
23%:2%。 然 后 ， 在 第 六 场 比赛 中 ,深蓝 迅 速 抓 住 了 卡 斯 帕 罗 夫 犯 下 的 一 个 错误 。 卡 斯 帕 罗 夫 
别 无 选择 ， 只 好 认输 ， 深 蓝 从 而 成 为 第 一 台 击败 国际 象棋 特级 大 师 的 机 器 。 

深蓝 令 人 震惊 地 战胜 卡 斯 帕 罗 夫 现 在 已 成 为 历史 ，IBM 研究 院 院 长 查尔斯 - 利克 尔 开始 寻 
找 新 的 挑战 。2004 年 ， 肯 “' 詹 宁 斯 在 美国 智力 竞赛 节目 “人 危险 边缘 ”中 获得 史无前例 的 74 连 
胜 ， 这 让 数 以 百 万 人 着 迷 ， 利 克 尔 也 为 之 着 迷 。 当 看 到 人 詹 宁 斯 启 得 一 个 又 一 个 比赛 后 ， 利 克 尔 
大 胆 地 想 : 建造 一 台 可 以 在 “危险 边缘 ”节目 中 获胜 的 机 器 也 是 有 可 能 的 。 此 外 ， 他 相信 IBM 
研究 院 有 建造 这 样机 器 的 人 才 。 他 请 大 卫 ' 费 鲁 奇 博士 领导 这 项 工作 。 

IBM 的 科学 家 并 不 急于 承担 利克 尔 提出 的 大 胆 项 目 。 他 们 有 充分 的 理由 怀疑 这 样 的 机 器 能 
否 建成 ， 毕 竟 创 造 深蓝 已 经 够 难 的 了 。 玩 “危险 边缘 ” 远 比 下 国际 象棋 难 。 在 国际 象棋 中 ， 
问题 域 是 由 固定 和 明确 的 规则 以 及 有 限 ( 尽 管 非 常 大 ) 的 解 空 间 清楚 地 定义 的 。 另 一 方面 ,“ 危 
险 边缘 ”中 的 问题 几乎 涵盖 了 无 限 的 问题 空间 ， 其 中 混合 着 变幻 莫 测 的 人 类 语言 、 概 念 之 间 的 
奇怪 关系 、 双 关 语 和 大 量 的 非 结 构 化 事实 信息 。 例 如 ， 一 个 “危险 边缘 ”的 分 类 可 能 称 为 
“Doozy Twos”， 其 中 涉及 一 个 非洲 领导 人 ( Benjamin Tutu) 、 一 件 衣服 (tutu skirt) 、 一 首 阿尔 ， 
乔 尔 森 ( Al Jolson ) 的 歌 (Toot Toot Tootsie ) 和 一 种 弹药 的 尺寸 (0. 22 caliber ) 。 一 个 人 看 到 这 种 关 
系 不 难 (尤其 是 答案 被 揭晓 后 ) ， 而 计算 机 就 完全 困惑 了 。 

为 了 使 游戏 公平 ， 沃 森 (Watson ) 要 尽 可 能 地 模仿 人 类 参赛 者 。 它 不 允许 连接 到 因特网 或 任何 
其 他 计算 机 上 ， 而 且 要 求 沃 森 回答 问题 时 要 按 下 一 个 会 发 出 “ 喻 喻 ” 声 的 按钮 。 由 于 沃 森 没有 处 
理 声音 或 图 像 的 程序 ， 所 以 在 比赛 中 不 使 用 视觉 和 完全 音频 的 提示 ， 例 如 音乐 的 选择 。 

一 且 读 取 一 个 提示 后 ， 沃 森 会 发 起 几 个 并 行进 程 。 每 个 进程 检查 这 个 提示 的 不 同方 面 ， 这 
样 可 以 缩小 解 的 空间 并 构想 出 一 个 假设 作为 答案 。 这 个 假设 包括 正确 的 概率 。 沃 森 选 择 最 有 可 
能 的 假设 ， 或 者 ， 如 果 正 确 性 概率 达 不 到 预定 的 阔 值 ， 就 根本 没有 假设 可 以 选择 。 沃 森 的 设计 
者 确定 ， 如 果 沃 森 尝 试 回答 70% 的 问题 ， 并 且 回 答 这 些 问 题 的 正确 率 达 到 85% ， 那 么 它 将 赢 
得 比赛 。 没 有 人 类 参赛 者 曾经 做 到 这 样 好 。 

使 用 沃 森 的 算法 ， 一 台 典 型 的 台式 机 将 需要 大 约 两 小 时 才能 想 出 一 个 好 的 假设 。 而 沃 森 必 
须 在 不 到 3s 的 时 间 内 做 完 这 件 事 。 它 利用 一 个 名 为 DeepQA 的 大 规模 并 行 架构 实现 了 这 个 任 
务 。 这 个 系统 依靠 90 台 IBM POWER 750 服务 器 。 每 个 服务 器 配备 了 4 个 POWER7 处 理 器 ， 每 
个 POWER7 处 理 器 有 8 个 核 ， 共 有 2880 个 处 理 器 核 。 在 参加 “危险 边缘 ”比赛 时 ， 每 个 核 可 
以 访问 16TB 主 存储 器 和 4TB 集群 存储 器 。 

不 像 深 蓝 ， 沃 森 不 能 使 用 编程 的 方法 ， 也 不 能 用 蛮 力 来 解决 问题 : 问题 空间 太 大 了 。 因 
此 ， 沃 森 的 设计 者 采用 的 方法 就 像 人 类 解决 问题 那样 : 沃 森 使 用 来 自 成 千 上 万 的 新 闻 源 、 期 刊 
和 书籍 的 数 百 万 兆 字 节 的 非 结构 化 数据 进行 “学 习 "。DeepQA 算法 给 沃 森 提供 了 以 类 人 类 的 
方式 从 原始 数据 中 综合 信息 的 能 力 。 沃 森 用 事实 和 不 完全 信息 得 出 推论 和 提出 假设 。 沃 森 能 够 
在 情境 中 理解 信息 : 同样 的 问题 在 不 同 的 情境 中 ， 可 能 会 产生 不 同 的 答案 。 
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在 比赛 的 第 三 天 ， 即 2011 年 2 月 16 日 ， 沃 森 打 败 了 两 位 “危险 边缘 ”的 冠军 肯 ' 詹 宁 斯 
和 布 拉 德 . 鲁 特 , 一举 震惊 世界 。 它 获得 的 奖金 捐赠 给 了 慈善 机 构 ， 但 沃 森 对 人 类 的 服务 才刚 
刚 开 始 。 沃 森 从 非 结 构 化 数据 池 中 吸收 知识 的 能 力 和 推理 能 力 ， 使 它 成 为 医学 院 的 完美 候选 
者 。2011 年 年 初 ，IBM 公司 、WellPoint 公司 和 纪念 斯 隆 -凯特 琳 癌症 中 心 ( Memorial Sloan- Ket- 
tering Cancer Center) 让 沃 森 吸收 了 600 000 多 件 医 学 证 明 以 及 来 自 和 2 种 医学 期 刊 和 肿瘤 学 研究 
文献 的 200 万 页 文本 。 用 WellPoint 公司 的 护士 提供 的 14 700h 的 现场 培训 作为 沃 森 的 资料 同化 
的 补充 。 然 后 ， 给 沃 森 输入 了 25 000 个 测试 案例 场景 和 1500 个 真实 案例 ， 从 这 些 案例 中 它 表 
现 出 从 堆积 如 山 的 复杂 医学 数据 中 抽取 有 意义 的 信息 的 能 力 ， 其 中 一 些 医学 数据 是 非 正式 的 自 
然 语 言 ， 如 医生 的 笔记 、 病 人 记录 、 医 学 注释 和 临床 反馈 。 继 在 “危险 边缘 ”取得 成 功 之 后 ， 
沃 森 又 在 医学 院 取得 了 成 功 。 基 于 沃 森 技术 的 商业 产品 ， 包 括 “ 交 互 式 癌症 医疗 方案 建议 ” 
和 “交互 式 医疗 评审 员 ”， 现 在 都 是 可 以 使 用 的 ， 它们 有 望 改 进 对 癌症 患者 的 医疗 处 理 速度 和 
准确 性 。 | 

虽然 沃 森 的 应 用 和 能 力 一 直 在 增长 ,但 是 沃 森 占 用 的 空间 一 直 在 缩小 。 在 短 短 几 年 里 ， 系 
统 的 性 能 提高 了 240% ， 物 理 资 源 减 少 了 75%。 沃 森 现 在 可 以 运行 在 一 个 POWER 750 服务 器 
上 ， 这 导致 一 些 人 声称 “片上 沃 森 ”即将 来 临 。 

从 沃 森 的 事例 中 ， 我 们 不 仅 看 到 了 一 个 惊人 的 “危险 边缘 ”的 参赛 者 或 者 一 流 的 肿瘤 学 
家 ， 而 且 也 看 到 了 计算 的 未 来 。 不 再 是 训练 人 使 用 计算 机 ， 而 是 计算 机 用 模糊 和 不 完整 的 信息 
训练 自己 与 人 交互 。 明 天 的 系统 将 满足 人 类 的 条 件 。 正 如 费 鲁 奇 博士 所 说 ， 计 算 机 除了 变 得 像 
沃 森 之 外 ， 根 本 就 没有 其 他 未 来 。 计 算 机 只 能 朝 这 个 方向 发 展 。 


本 章 小 结 

在 本 章 中 ， 我 们 简要 介绍 了 计算 机 的 组 织 和 体系 结构 ， 并 展示 了 它们 之 间 的 差异 。 我 们 还 用 一 个 虚 
构 的 计算 机 广告 介绍 了 一 些 术语 ， 其 中 许多 术语 将 在 以 后 的 章节 中 展开 讨论 。 

从 历史 上 看 ,计算 机 只 是 计算 的 机 器 。 随 着 计算 机 变 得 越 来 越 复杂 ， 它 们 变 成 了 通用 机 器 ,这样 的 
机 器 需要 把 系统 看 作 一 个 层次 化 的 结构 ， 而 不 是 一 个 巨大 的 机 器 。 在 这 个 层次 结构 中 每 一 层 都 有 特定 的 
用 途 ， 所 有 层次 都 有 助 于 最 小 化 高 级 程序 设计 语言 或 应 用 程序 与 构成 物理 硬件 的 门 和 导线 之 间 的 语义 鸿 
沟 。 也 许 在 计算 中 影响 程序 员 的 一 个 最 重要 进展 是 冯 “' 诺 依 曼 机 中 存储 程序 概念 的 引入 。 虽 然 有 其 他 架 
构 模 型 ， 但 是 在 当今 通用 的 计算 机 中 冯 “' 诺 依 曼 架构 占 主 导 地 位 。 


扩展 阅读 


我 们 鼓励 你 阅读 计算 机 历史 的 简要 介绍 。 我 们 认为 你 会 发 现 这 个 主题 耐人寻味 ， 因 为 其 中 既 会 涉及 
机 器 ， 又 会 涉及 人 。 你 可 以 读 John Atanasoff 写 的 《被 遗忘 的 计算 机 之 父 》， 见 参考 文献 Mollenhoff( 1988 ) 。 
这 本 书记 录 了 Atanasoff 和 Mollenhoff 之 间 的 奇怪 的 关系 ,叙述 了 Honeywell 和 Sperry Rand 两 个 电脑 巨头 之 
间 的 官司 。 这 次 审判 最 终 给 了 Atanasoff 应 有 的 认可 。 

为 了 浏览 计算 机 的 历史 ， 可 以 读 由 Rochester 和 Gantz( 1983 ) 写 的 书 。 读 Augarten( 1985 ) 写 的 有 插图 
的 计算 机 历史 书 是 令 人 快乐 的 ， 书 中 包含 了 数 百 个 很 难 找到 的 早期 计算 机 和 计算 设备 的 图 片 。 关 于 计算 
机 发 展 历史 的 完整 讨论 ， 可 以 看 看 Cortada( 1987 ) 写 的 三 卷 本 词典 。 在 Ceruzzi( 1998) 写 的 书 中 ， 有 对 计算 
机 历史 特别 深思 熟 虑 的 解释 。 如 果 你 对 历史 上 计算 机 的 优秀 案例 研究 感 兴趣 ， 可 以 看 Blaauw 和 Brooks 
(1997) 写 的 书 。 

读 McCartney( 1999) 写 的 关于 ENIAC 的 书 ，Chomsky 和 Leonsis( 1988) 写 的 IBM PC 的 发 展 历史 以 及 
Toole(1998 ) 写 的 艾 达 ' 洛 夫 莱 斯 的 传记 ， 也 会 得 到 丰厚 的 回报 。Polachek(1997) 写 的 文章 中 给 出 了 一 幅 
清晰 的 计算 弹道 表 复 杂 性 的 图 。 看 完 这 篇 文章 ， 你 就 会 明白 为 什么 军队 会 愿意 为 任何 使 过 程 更 快 或 更 精 
确 的 技术 支付 费用 。Maxfield 和 Brown(1997 ) 写 的 书包 含 了 有 趣 的 对 计算 起 源 和 历史 的 研究 以 及 对 计算 机 
是 如 何 工作 的 深入 解释 。 
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关于 摩尔 定律 更 多 的 信息 ， 我 们 向 读者 介绍 Schaller( 1997) 写 的 书 。 关 于 早期 计算 机 的 详细 描述 以 及 
行业 先锋 的 简介 和 回忆 ， 可 以 查询 按 季 度 发 表 的 《IEEE 计算 历史 的 编 年 史 》。 计 算 机 博物 馆 历史 中 心 的 网 
址 是 www. computerhistory. org。 它 包含 各 种 展品 、 研 究 、 时 间 表 和 收藏 。 现 在 许多 城市 都 有 计算 机 博物 馆 
并 允许 参观 者 使 用 一 些 老式 计算 机 。 

在 标准 制定 机 构 的 网 站 上 可 以 找到 本 章 讨论 的 (以 及 本 章 没 有 讨论 的 ) 大 量 的 信息 。IEEE 的 网 址 是 
www. ieee. org; ANSI 的 网 址 是 www. ansi org; ISO 的 网 址 是 www. iso. ch; BSI 的 网 址 是 www. bsi- glob- 
al. com; ITU-T 的 网 址 是 www. itu. int。1ISO 网 站 提供 了 大 量 的 信息 和 标准 参考 材料 。 

万 维 网 计算 机 体系 结构 主页 ( WWW Computer Architecture Home Page) 的 网 址 是 www. cs. wisc. edu/ ~ 
arch/www/ ,其 中 包含 了 与 计算 机 体系 结构 信息 相关 的 综合 索引 。 许 多 USENET 新 闻 组 也 专门 讨论 这 些 话 
题 ， 包 括 comp. arch 和 comp. arch. storage。 

2000 年 5 ~6 月 麻 省 理工 学 院 发 行 的 《技术 评论 ) 杂 志 专 门 讨论 那些 可 能 是 未 来 计算 机 基础 的 体系 结 
构 。 花 时 间 阅 读 这 本 杂志 是 值得 的 。 事 实 上 ， 与 我 们 讲 的 问题 可 能 是 一 致 的 。 

对 于 唯一 真正 的 人 类 计算 机 的 报告 ， 我 们 邀请 你 阅读 Grier 的 书 《 当 计算 机 是 人 类 时 》。 另 外 ， 他 提 
出 的 令 人 激动 的 人 类 计算 机 的 报告 ， 推 动 了 大 萧条 时 期 公共 事业 振兴 署 ( Works Progress Administration ， 
WPA) 的 数学 表 项 目 。 这 些 “ 表 工厂 ”做 出 的 贡献 对 于 美国 在 二 战 中 取得 胜利 至 关 重 要 。 这 个 工作 更 简 
短 的 报告 也 可 以 在 Grier( 1998 ) 发 表 在 IEEE 的 《计算 机 历史 编 年 史 》 上 的 文章 中 找到 。 

2012 年 5 ~6 月 出 版 的 期 刊 4IBM 的 研究 和 发 展 》 专 门 介绍 建造 沃 森 的 内 容 。 由 Ferrucci 和 Lewis 写 的 
两 篇 文章 对 这 个 开创 性 机 器 的 挑战 和 胜利 提供 了 非常 深刻 的 见解 。IBM 的 白皮书 ,《 沃 森 一 一 一 个 为 了 回 
答 问 题 设计 的 系统 ) 对 沃 森 硬 件 架 构 提 供 了 很 好 的 总 结 。《“ 深 蓝 ” 揭 秘 : 追寻 人 工 智 能 圣杯 之 旅 》 是 许 峰 
雄 以 第 一 人 称 介 绍 建造 深蓝 的 书 。( 译 者 注 : 这 本 书 的 中 文 版 是 许 峰 雄 本 人 翻译 的 ,《“ 深 蓝 ” 揭 秘 : 追 
寻 人 工 智能 圣杯 之 旅 ) 就 是 中 文 版 的 书 名 。) 对 “土耳其 机 械 人 ” 感 兴趣 的 读者 可 以 在 Tom Standage 写 的 
书 《 土 耳 其 机 械 人 》 中 找到 更 多 信息 。 
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计算 机 组 织 和 计算 机 体系 结构 之 间 的 区 别 是 什么 ? 
什么 是 ISA? 


. 硬件 和 软件 等 价 原理 的 重要 性 是 什么 ? 
. 说 出 每 台 计 算 机 的 3 个 基本 组 件 的 名 字 。 
. 用 " 吉 " 前 缀 表示 的 是 10 的 多 少 次 方 ? 它 近 似 等 于 2 的 多 少 次 方 ? 


用 “ 微 " 前 级 表示 的 是 10 的 多 少 次 方 ? 它 近 似 等 于 2 的 多 少 次 方 ? 


. 通常 用 于 测量 计算 机 时 钟 速度 的 单位 是 什么 ? 
. 平板 电脑 的 显著 特点 是 什么 ? 
. 说 出 两 种 计算 机 存储 器 的 名 字 。 


IEEE 的 使 命 是 什么 ? 


. 使 用 ISO 的 组 织 的 全 称 是 什么 ?ISO 是 缩写 词 吗 ? 
. ANSI 是 哪个 组 织 的 缩写 词 ? 

. 致力 于 电话 、 电 信和 数据 通信 事务 的 瑞士 组 织 的 名 称 是 什么 ? 
。 谁 是 计算 之 父 ? 为 什么 ? 

. 穿孔 卡片 的 意义 是 什么 ? 

. 说 出 计算 机 发 展 中 的 两 个 驱动 因素 。 

. 是 什么 使 晶体 管 比 电子 管 有 了 巨大 的 改进 ? 

. 集成 电路 与 晶体 管 有 什么 不 同 ? 

. 解释 SSI、MSI、LSI 和 VLSI 之 间 的 不 同 之 处 。 

. 什么 技术 催生 了 微型 计算 机 的 发 展 ?” 为 什么 ? 
.“ 开 放 架 构 ” 的 含义 是 什么 ? 

.陈述 摩尔 定律 。 

. 罗 克 定律 如 何 与 摩尔 定律 相关 联 ? 


说 出 并 解释 被 普遍 认可 的 计算 机 分 层 架 构 的 7 个 层次 。 这 种 安排 如 何 帮助 我 们 理解 计算 机 系统 ? 


. 抽象 这 个 术语 如 何 应 用 于 计算 机 组 成 和 体系 结构 ? 





. 是 什么 使 汉 ' 诺 依 曼 架构 区 别 于 之 前 的 系统 ? 
.说 出 汉 ' 诺 依 曼 架构 的 特征 。 

. 取 指 - 译 码 -执行 周期 是 如 何 工作 的 ? 

. 什么 是 多 核 处 理 器 ? 

. 云 计 算 的 关键 特征 是 什么 ? 

. 3 种 类 型 的 云 计算 平台 分 别 是 什么 ? 

. 从 供应 商 的 角度 以 及 消费 者 的 角度 看 ， 云 计算 的 主要 挑战 是 什么 ? 
.面向 服务 的 计算 的 优 缺 点 是 什么 ? 

. 并 行 计算 的 含义 是 什么 ? 

. 阿 姆 达尔 定律 的 基本 前 提 是 什么 ? 

. 什么 使 得 沃 森 不 同 于 传统 的 计算 机 ? 


习题 


1 
2 


硬件 和 软件 在 哪些 方面 不 同 ? 它们 在 哪些 方面 相同 ? 
a) 1s 等 于 多 少 ms? 
b) 1s 等 于 多 少 ns? 
c) lms 等 于 多 少 ns? 
d) lms 等 于 多 少 ns? 
e) 1hs 等 于 多 少 ns? 
f) 1GB 等 于 多 少 KB? 
g) 1MB 等 于 多 少 KB? 
h) 1GB 等 于 多 少 MB? 
i) 20MB 等 于 多 少 B? 
j) 2GB 等 于 多 少 KB? 


. 运行 在 纳 秒 级 别 的 某 个 部 件 比 运行 在 毫秒 级 别 的 某 个 部 件 快 多 少 个 数量 级 ? 
. 假设 你 准备 买 一 台新 计算 机 供 个 人 使 用 。 首 先 ， 看 看 各 种 杂志 和 报纸 上 的 广告 ， 列 出 你 不 太 懂 的 术 


语 。 查 阅 这 些 术 语 并 简要 地 写 出 解释 。 确 定 影 响 购买 哪 种 计算 机 的 重要 因素 ， 并 列 出 这 些 因 素 。 在 你 
选 好 了 想 购买 的 系统 后 ， 确 定 哪 些 术语 与 硬件 有 关 ， 哪 些 术语 与 软件 有 关 。 


. 平板 电脑 制造 商 在 成 本 、 功 耗 、 重 量 和 电池 寿命 等 约束 条 件 下 不 懈 地 工作 。 你 认为 完美 的 平板 电脑 应 


该 是 什么 样子 的 ? 屏幕 应 该 多 大 ? 即使 重量 增加 ， 你 也 想 要 续航 更 持久 的 电池 吗 ? 重量 最 大 不 应 该 超 
过 多 少 ? 你 是 选择 低 成 本 还 是 选择 高 性 能 ? 电池 应 该 是 消费 者 可 更 换 的 吗 ? 


. 选择 你 最 喜欢 的 计算 机 语言 编写 一 个 小 程序 。 编 译 完 程 序 后 ， 看 看 是 否 可 以 确定 源 代码 指令 与 编译 器 


生成 的 机 器 语言 指令 的 比例 。 如 果 你 增加 一 行 源 代码 ， 机 器 语言 程序 会 有 什么 影响 ? 试 着 增加 不 同 的 
源 代码 指令 ， 比 如 一 个 加 法 指令 和 一 个 乘法 指令 。 增 加 不 同 指令 ， 机 器 代码 文件 的 大 小 有 什么 变化 ? 
对 这 个 结果 给 出 你 的 看 法 。 


.回应 在 1.5 节 中 提出 的 想法 : 如 果 今 天 发 明了 计算 机 ， 你 想 给 计算 机 起 个 什么 名 字 ? 对 于 你 的 回答 ， 


至 少 给 出 一 个 很 好 的 理由 。 


8. 简 述 计算 历史 上 的 两 个 突破 性 进展 。 


9. 


4 10. 


11. 
12. 


现在 还 有 可 能 用 一 个 像 “土耳其 机 械 人 ”那样 的 机 器 人 糊弄 人 们 吗 ? 现在， 如 果 你 想 创建 一 个 “ 土 耳 
其 人 ”， 它 应 如 何不 同 于 18 世纪 的 版 本 ? 

假设 集成 电路 芯片 上 的 一 个 晶体 管 是 2pm 大 小 。 根 据 摩尔 定律 , 在 2 年 内 晶体 管 会 是 多 大 ? 摩尔 定 
律 与 程序 员 是 什么 样 的 关系 ? 

什么 环境 使 得 IBM PC 如 此 成 功 ? 

列 出 5 个 个 人 计算 机 的 应 用 。 计 算 机 的 应 用 有 限制 吗 ? 你 有 没有 想象 过 在 不 久 的 将 来 会 有 何 种 完全 
不 同和 令 人 激动 的 应 用 ? 如 果 有 ， 它 是 什么 ? 
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13; 


14. 


21. 
22. 


EB 


在 汉 ， 诺 依 曼 模型 中 ,解释 下 面部 件 的 作用 : 

a) 处理 单 元 

b) 程 序 计数 器 

在 汉 : 诺 依 曼 架 构 下 ， 程 序 和 数据 都 是 存储 在 主 存储 器 中 的 ， 因 此 ， 当 认为 主 存储 器 的 某 个 地 方 保 
存 了 一 块 数据 ， 而 实际 上 保存 的 是 程序 指令 时 ， 就 有 可 能 意外 (或 故意 ) 修改 了 自己 的 程序 。 这 种 情 
况 对 作为 程序 员 的 你 有 什么 影响 ? 


. 解释 为 什么 现代 计算 机 由 多 个 层次 的 虚拟 机 组 成 。 

. 解释 云 计 算 平 台 的 3 种 主要 类 型 。 

. 希望 迁移 到 云 平 台 的 组 织 所 面 对 的 挑战 是 什么 ?风险 和 收益 是 什么 ? 

. 云 计算 是 否 消除 了 一 个 组 织 对 其 计算 基础 设施 的 所 有 顾虑 ? 

. 解释 “ 取 ” 一 条 指令 意味 着 什么 。 

. 阅读 一 份 当 地 受 欢迎 的 报纸 并 搜索 招聘 职位 。( 也 可 以 查看 一 些 比 较 受 欢迎 的 在 线 职 业 网 站 。) 哪些 工 


作 需 要 特定 的 硬件 知识 ?哪些 工作 隐 含 着 计算 机 硬件 知识 ?所 需 的 硬件 知识 与 公司 或 其 职位 有 什么 

关联 吗 ? 

列 出 并 描述 计算 机 在 商业 和 社会 其 他 领域 中 一 些 常见 的 应 用 和 不 常见 的 应 用 。 

摩尔 定律 的 技术 专家 的 观点 是 每 个 芯片 上 的 晶体 管 数量 大 约 每 18 个 月 翻 一 番 。 在 20 世纪 90 年 代 ， 

摩尔 定律 开始 描述 为 每 18 个 月 微 处 理 絮 的 处 理 能 力 翻 一 番 。 根 据 摩尔 定律 的 新 变化 ， 回 答 如 下 

问题 : 

a) 在 你 学 完 计算 机 组 成 和 体系 结构 课程 之 后 ， 你 会 有 一 个 非常 好 的 新 芯片 设计 想法 ， 这 个 想法 可 以 
使 处 理 器 的 速度 比 现在 市 场 上 最 快 的 处 理 器 快 6 倍 。 不 幸 的 是 ， 你 需要 花 四 年 半 的 时 间 存 钱 、 创 
建 原 型 和 开发 产品 。 如 果 摩 尔 定律 持续 有 效 ， 你 是 花 钱 开发 和 生产 芯片 ， 还 是 投资 在 其 他 有 风险 
的 地 方 ? 

b) 假设 我 们 有 一 个 需要 解决 的 问题 ， 使 用 当前 的 技术 通常 要 花 100 000h 的 计算 机 时 间 才 能 解决 。 下 
列 哪 一 项 能 最 早 给 我 们 解决 方案 ?” (1) 用 快 两 倍 的 算法 蔡 换 当前 解决 方案 中 的 算法 ， 但 仍 在 当前 
技术 下 运行 ; (2) 等 待 3 年 ,假设 按照 摩尔 定律 每 18 个 月 计算 机 的 性 能 翻 一 番 ， 在 解决 方案 中 使 
用 当前 的 算法 , 但 是 在 3 年 后 的 新 技术 下 运行 。 


. 摩尔 定律 的 局 限 性 是 什么 ? 为 什么 这 个 定律 不 能 永远 有 效 ? 请 解释 原因 。 
. 摩尔 定律 的 技术 含义 是 什么 ? 它 对 未 来 有 什么 影响 ? 
. 费 鲁 奇 博士 认为 所 有 计算 机 总 有 一 天 会 变 得 像 沃 森 那 样 ， 你 认同 他 的 观点 吗 ? 如 果 你 有 一 台 像 平板 


电脑 大 小 的 沃 森 ， 你 想 用 它 做 什么 ? 
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2.A :引言 


计算 机 的 组 织 结构 在 很 大 程度 上 取决 于 它 如 何 表示 数字 、 字 符 和 控制 信息 ， 反 之 亦 然 。 
多 年 来 形成 的 标准 和 约定 也 在 很 多 方面 决定 了 计算 机 的 组 织 结构 。 本 章 介绍 计算 机 存储 和 
操作 数字 和 字符 的 各 种 方法 。 以 下 各 节 提 出 的 想法 构成 了 理解 所 有 数字 系统 组 织 和 功能 的 
基础 。 

在 数字 计算 机 中 最 基本 的 信息 单位 称 为 位 (bit) ，bit 是 二 进 制 数字 ( binary digit) 的 缩写 。 
具体 而 言 ， 位 不 过 是 表示 计算 机 电路 内 的 “ 开 ” 或 “ 关 ”( 或 “高 ”“ 低 ”) 的 状态 。1964 年 ， 
IBM System/360 计算 机 的 设计 者 确立 了 一 个 约定 ， 这 个 约定 将 8 位 作为 计算 机 最 基本 可 寻 址 单 
位 。 他 们 称 这 个 8 位 集合 为 一 个 字 节 。 

计算 机 中 的 字 由 两 个 或 两 个 以 上 相 邻 字 节 构成 ， 通 常 这 些 字 节 被 一 起 访问 和 处 理 。 字 大 小 
表示 由 特定 架构 最 有 效 处 理 的 数据 大 小 。 在 计算 机 组 织 环境 中 ， 字 可 以 是 16 位、32 位 、64 位 
或 任何 其 他 有 意义 的 长 度 (包括 不 是 8 的 倍数 ) 。1 个 8 位 字 节 可 以 分 为 两 个 4 位 ，1 个 4 位 称 
为 半 字 节 ( 或 nybbles) 。 因 为 字 节 的 每 一 位 都 具有 1 个 位 置 编号 ， 因 此 包含 最 小 位 置 编号 的 半 
字 节 称 为 低 半 字 节 ， 另 一 半 为 高 半 字 节 。 


2.2 按 位 计数 系统 
在 16 世纪 中 叶 的 某 个 时 候 ， 欧 洲 接 受 了 阿拉 伯 人 和 印度 教徒 使 用 了 近 1000 年 的 十 进 制 
(或 基数 10 ) 编号 系统 。 今 天 ， 我 们 认为 数字 243 意味 着 200 + 40 +3。 尽 管事 实 上 零 意味 着 
“什么 都 没有 ”， 但 几乎 每 个 人 都 知道 1 和 10 之 间 有 实质 性 的 差异 。 
按 位 计数 系统 背后 的 想法 是 数字 值 可 以 通过 增加 基数 (或 基 ) 的 宕 来 表示 。 这 经 常 被 称 为 
加 权 计 数 系统 ， 因 为 每 个 位 置 是 通过 基数 的 老 加 权 得 到 的 。 
按 位 计数 系统 中 有 效 数 字 的 位 置 与 该 系统 的 基数 大 小 相等 。 例 如 ， 在 十 进 制 系统 中 有 10 
个 数字 (0 ~9) ， 在 三 进 制 (基数 3) 系 统 中 有 3 个 数字 ， 即 0、1 和 2。 在 基数 系统 中 最 大 的 有 效 
数字 比 基 数 小 ， 因 此 8 在 任何 小 于 9 的 基数 系统 中 都 不 是 有 效 的 数字 。 为 了 区 分 不 同 基数 的 数 
字 ， 我 们 使 用 基数 作为 下 标 ， 如 33%, 代 表 十 进 制 数 33。( 在 本 文中 ,不 带 下 标的 数字 为 十 进 
制 。) 任 何 十 进 制 整数 在 任何 其 他 整数 基 系 统 中 都 可 以 精确 表示 (参见 例 2. 1)。 
把 3 个 数字 表示 为 基数 的 宕 。 
243.51 ,=2x1I0+4x10+3x1l10 +5x10" +1x10™ 
212 = 3 FX +2 X3 e237 
i10110; = 1 xX2 +0%X2 +1X2 +1x2 +0x2 三 2201 a 
在 计算 机 科学 中 两 个 最 重要 的 基数 是 二 进 制 (基数 为 2) 和 十 六 进 制 (基数 为 16 ) 。 另 一 个 
我 们 感 兴 趣 的 基数 是 八进制 (基数 为 8) 。 二 进 制 系统 仅 使 用 数字 0 和 1; 八进制 使 用 0 ~7。 十 
六 进 制 系统 允许 使 用 数字 0 ~9， 以 及 A、B、C、D、E 和 下 用 于 表示 数字 10 ~15。 表 2-1 显示 
了 一 些 基 数 。 





2.3 不 同 进 制 之 间 的 转换 

戈 特 弗 里 德 . 莱 布 尼 茨 (1646 一 1716 ) 首次 将 十 进 制 系统 推广 到 基于 其 他 基 的 计数 系统 中 。 
他 认为 任何 整数 都 可 以 由 一 系列 的 1 和 0 表示 。 直 到 20 世纪 40 年 代 末 建成 第 一 个 二 进 制 数字 
计算 机 之 前 ， 这 个 二 进 制 系统 只 是 一 种 数学 上 的 好 奇 心 。 今 天 ， 它 几乎 成 为 每 一 个 依赖 数字 控 
制 的 电子 设备 的 核心 。 

由 于 其 简单 性 ， 所 以 二 进 制 系统 可 以 很 容易 地 转换 为 电子 电路 ， 同 时 ， 也 便于 人 们 理解 。 
经 验 丰富 的 计算 机 专业 人 员 可 以 很 轻松 地 识别 较 小 的 二 进 制 数 (如 表 2-1 所 示 )。 但 是 ， 通常 在 
转换 较 大 值 和 分 数 时 ， 需 要 一 台 计算 器 或 者 铅笔 和 纸 。 幸 运 的 是 ， 转 换 技术 通过 一 点 练习 就 可 
以 很 容易 地 掌握 。 我 们 将 在 下 面 的 小 节 中 展示 一 些 较 简单 的 转换 技术 。 


表 2-1 一 些 需要 记 住 的 数字 


十进制 数 | 4 位 二 进 制 数 ，| 十 六 进 制 数 


© 


1 
3 
4 
5 
6 
7 
8 
9 


=1024 
25 =32768 
21! =65 536 











2. 3.1 无 符号 整数 的 转换 


我 们 从 无 符号 数 的 基本 转换 开始 。 转 换 有 符号 数 ( 可 以 是 正 数 或 负数 ) 更 复杂 ， 重 要 的 是 ， 
在 继续 转换 有 符号 数 之 前 需要 首先 了 解 转 换 的 基本 技术 。 

基数 系统 之 间 的 转换 可 以 通过 使 用 重复 减法 或 除 留 余数 法 来 完成 。 减 法 比较 麻烦 ， 
并 且 需 要 熟悉 所 使 用 的 基数 的 过 。 但 是 由 于 它 是 两 种 方法 中 更 直观 的 ， 所 以 我 们 将 首先 
解释 它 。 

例如 ， 假 设 我 们 要 将 104,, 转 换 为 基数 为 3 的 数 。 我 们 知道 3 = 81， 它 是 小 于 104 的 3 的 最 
大 寡 ， 所 以 基数 3 的 数字 将 会 有 5 位 数 的 宽度 (每 个 基数 宕 一 个 : 0 ~4) 。 我 们 用 104 减 去 81， 
差 值 为 23 。 我 们 知道 下 一 个 宕 为 3， 但 3: =27 太 大 了 ，23 不 够 减 ， 所 以 注意 到 零 “ 占 位 符 "， 
并 寻找 需要 多 少 次 用 3? =9 去 分 23。 我 们 看 到 它 可 以 执行 两 次 并 减 去 18。 剩 下 5， 从 中 减 去 3 
结果 为 3， 留 下 2, 2 =2 x3"。 这 些 步 又 显示 在 例 2.2 中 。 

使 用 重复 减法 将 104。 转 换 为 基数 为 3 的 数 。 
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104,, = 10 212， 4 


除 留 余数 方法 是 比重 复 减法 更 快 更 容易 的 方法 。 它 采用 的 想法 是 使 用 基数 的 连续 除法 ， 实 
际 上 是 基数 寡 的 连续 减法 。 我 们 顺序 地 除 以 基数 ， 然 后 从 底部 到 项 部 读 取得 到 的 余数 。 该 方法 


104 





这 
1 


2 
0 


104 除 以 3 结果 是 34， 余 数 为 2 
34 除 以 3 结果 是 11， 余 数 为 1 
11 除 以 3 结果 是 3， 余 数 为 2 
3 除 以 3 结果 是 1， 余 数 为 0 


见 例 2.3。 
转换 1041 到 基数 为 3 的 数 。 
本 
3 
3 
1 
3 


从 下 向 上 读 余数 部 分 ， 得 到 : 


把 147。 转 换 为 二 进 制 。 





Sle 





1 


1 除 以 3 结果 是 0， 余 数 为 1 


104,, =10 212,。 < 
此 方法 适用 于 任何 基数 ， 并 且 由 于 计算 的 简单 性 ， 所 以 它 在 从 十 进 制 到 二 进 制 的 转换 中 特 
别 有 用 。 例 2.4 显示 这 样 的 转换 过 程 。 


2|147 1 147 除 以 2 结果 是 73， 余 数 为 1 
2 [73 1 73 除 以 2 结果 是 36， 余数 为 1 
2 |36 0 36 除 以 2 结果 是 18， 余数 为 0 
2 |18 0 18 除 以 2 结果 是 9， 余数 为 0 
2 |9 1 9 除 以 2 结果 是 4, 余数 为 1 
2 |4 0 4 除 以 2 结果 是 2， 余数 为 0 
2 |2 0 2 除 以 2 结果 是 1， 余数 为 0 
2 |1 1 1 除 以 2 结果 是 0， 余数 为 1 
0 
从 下 向 上 读 余数 ， 得 到 : 147 =10 010 011,。 a 


具有 NN 位 的 二 进 制 数 可 以 表示 无 符号 整数 的 范围 为 0~2" -1。 例如 ,4 位 可 以 表示 十 进 制 
数 0~15， 而 8 位 可 以 表示 数 0 ~255。 当 进行 二 进 制 数 的 算术 操作 时 ， 可 以 由 给 定位 数 表示 值 
的 范围 ， 这 非常 重要 。 考 虑 有 一 个 4 位 长 度 的 二 进 制 数 ， 我 们 希望 把 1111,(15%) 加 到 1111， 


40 第 2 章 





上 。 我们 知道 15 加 15 是 30, 但 30 不 能 仅 使 用 4 位 来 表示 。 这 是 一 个 有 溢出 的 例子 ， 其 发 生 
在 无 符号 二 进 制 表 示 中 ， 当 算术 运算 的 结果 在 给 定位 数 允 许 的 精度 范围 之 外 出 现 溢出 时 。 在 
2. 4 节 讨 论 有 符号 数字 时 ， 我 们 会 更 详细 地 解释 溢出 。 


2. 3.2 小 数 的 转换 


任何 基数 系统 中 的 小 数 在 任何 其 他 基数 系统 中 可 以 近似 为 这 个 基数 的 负 需 次 方 。 基 数 小 数 
点 将 一 个 数字 的 整数 部 分 与 小 数 部 分 分 隔 开 。 在 十 进 制 系统 中 ， 小 数 点 被 称 为 十 进 制 小 数 点 。 
二 进 制 小 数 有 二 进 制 小 数 点 。 
在 一 个 基数 小 数 点 的 右边 包含 循环 数字 串 的 小 数 在 另 一 个 基 上 不 一 定 有 循环 的 数字 序列 。 
例如 ，2/3 是 一 个 循环 的 十 进 制 小 数 ， 但 在 三 进 制 系统 中 它 的 结果 是 0.2;(2x3- =2 x1/3)。 
转换 整数 时 使 用 的 重复 减法 和 除 留 余 数 法 的 类 似 方法 可 以 在 不 同 基 数 之 间 转 换 小 数 。 例 
2.5 显示 了 如 何 使 用 重复 减法 把 十 进 制 数字 转换 到 五 进 制 。 
转换 十 进 制 数字 0. 4304, 到 以 5 为 基 的 数字 。 
0. 4304 
-0.4000 =5- x2 
0. 0304 
-0.0000 =5 一 x0 (一 个 占 位 符 ) 
0. 0304 
.0.0240 =5™ x3 
0. 0064 
-0.0064 =5-*x4 
0. 0000 
从 上 到 下 读 ， 得到: 0. 4304,, =0. 2034,。 -| 
因为 除 留 余数 方法 使 用 基数 的 正 寡 数 来 转换 整数 ， 所 以 我 们 将 使 用 乘法 来 转换 小 数 ， 因 为 
它们 以 基数 的 负 宕 数 表示 。 然 而 ， 不 是 像 上 面 操作 的 那样 找 余 数 ， 我 们 只 使 用 乘 以 基数 之 后 得 
到 的 整数 部 分 。 答 案 是 从 上 读 到 下 而 不 是 从 下 到 上 。 例 2.6 说 明了 该 过 程 。 
转换 十 进 制 数字 0. 4304 到 以 5 为 基 的 数字 。 
0. 4304 
这 
2. 1520 整数 部 分 是 2， 在 后 续 的 乘法 中 忽略 该 整数 
0. 1520 
洲 . 性 
0. 7600 整数 部 分 是 0， 我们 需要 使 用 它 作 为 一 个 占 位 符 
0. 7600 











x 


5 
3. 8000 整数 部 分 是 3， 在 后 续 的 乘法 中 忽略 该 整数 


0. 8000 
治 ”与 
4. 0000 小 数 部 分 现在 是 0， 所 以 我 们 做 完了 

从 上 到 下 读 ， 得 到 : 0. 4304,。= 0. 2034,。 < 


这 个 例子 被 设计 成 在 执行 几 步 后 就 停止 了 。 通 常情 况 下 ， 事 情 并 不 那么 顺利 ， 最 终 以 循环 
小 数 结束 。 大 多 数 计算 机 系统 有 专门 的 伟人 算法 ， 以 提供 一 个 可 预测 的 准确 度 。 然 而 ， 为 了 清 
楚 起 见 ， 当 所 需 的 精度 已 经 达到 时 ， 我 们 将 简单 地 丢弃 (或 截断 ) 后 面 的 数字 ， 如 例 2. 7 所 示 。 

转换 十 进 制 数字 0. 343 75,o 为 二 进 制 数字 ， 保 留 二 进 制 小 数 点 后 4 位。 
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0. 343 75 
x 2 
0.68750 ” 另 一 个 占 位 符 
0. 687 50 
x 2 
1.375 00 
0. 375 00 
x 和 
0. 750 00 


0.750 00 
区 2 
1.50000 ”这 是 第 四 位 ， 在 这 里 停止 。 
从 上 到 下 读 ， 得 到 : 0. 343 75,, =0. 0101,。 4 
刚刚 描述 的 方法 可 以 直接 将 任何 基数 中 的 数字 转换 到 其 他 基数 ， 如 从 基数 4 到 基数 3( 见 
例 2.8) 。 然 而 ， 在 大 多 数 情况 下 ， 首 先 转换 为 基数 10 然后 再 到 所 需 的 基数 ， 这 会 更 快 和 更 准 
确 ， 当 在 两 个 寡 的 基数 之 间 转 换 时 这 个 规则 是 一 个 例外 ， 关 于 这 一 点 会 在 下 一 节 看 到 。 
转换 四 进 制 数 3121, 到 以 3 为 基 的 数 。 
首先 ， 转 换 到 十 进 制 : 
3121, =3 x4 +1x4 +2x4'+1x4" 
=3x64+1 x16+2x4+1=217, 
然后 ， 转 换 到 以 3 为 基 的 数 。 








得 到 : 3121, =22 001,。 


2. 3. 3 2 的 窘 次 作为 基数 的 计数 系统 之 间 的 转换 

二 进 制 数 通常 用 十 六 进 制 表示 (有 时 用 八进制 表示 ) 以 提高 其 可 读 性 。 因 为 16 =2*， 所 以 4 
位 一 组 ( 称 为 十 六 进 制 的 ) 作为 一 位 十 六 进 制 的 数字 更 容易 被 识别 。 同 样 ， 因 为 8 =23， 所 以 3 
位 一 组 ( 称 为 八进制 的 ) 可 表示 一 个 八进制 数字 。 使 用 这 些 关系 ,我 们 只 需 看 一 看 就 可 以 将 一 
个 数字 从 二 进 制 转换 为 八进制 或 十 六 进 制 了 。 

转换 二 进 制 数 110010011101, 到 八进制 和 十 六 进 制 。 





oa 为 八进制 转换 分 为 3 位 一 组 
110010011101, = 6235, 

| A、 全 

1 为 十 六 进 制 转换 分 为 4 位 一 组 


110010011101, = C9D 。 本 
如 果 位 太 少 ， 可 以 在 前 面 添加 零 。 











2.4 有 符号 整数 表示 

我 们 已 经 讲述 了 如 何 将 无 符号 整数 从 一 个 基 转 换 为 男 一 个 基 。 对 于 有 符号 数 的 转换 ， 则 还 
需要 解决 一 些 其 他 问题 。 当 在 一 个 程序 中 声明 一 个 整 型 变量 时 ， 许 多 编程 语言 会 自动 为 其 分 配 
存储 区 ， 该 存储 区 中 的 第 一 位 作为 符号 。 按 照 约 定 ， 最 高 位 为 “1” 时 表示 负数 。 该 存储 区 域 
可 以 小 到 一 个 8 位 的 字 节 或 大 到 几 个 字 ， 这 取决 于 编程 语言 和 计算 机 系统 。 剩 余 位 (符号 位 之 
后 ) 用 于 表示 数字 本 身 。 

有 符号 数 的 表示 方式 取决 于 所 使 用 的 方法 。 有 3 种 常用 的 方法 。 最 直观 的 方法 是 有 符号 量 
值 ， 也 称 为 原 码 ， 它 使 用 除 符号 位 之 外 的 剩余 位 来 表示 数 的 量 值 。 这 种 方法 和 其 他 两 种 使 用 补 
码 概念 的 方法 将 在 后 面 介绍 。 


2.4.1 原 码 


到 目前 为 止 ， 我 们 可 能 忽略 了 负数 的 二 进 制 表示 。 正 整数 和 负 整数 的 集合 称 为 有 符号 整数 的 
集合 。 将 有 符号 整数 表示 为 二 进 制 的 问题 是 符号 一 一 我 们 应 该 如 何 对 这 个 数字 的 实际 符号 进行 纺 
码 呢 ? 原 码 表示 是 解决 这 个 问题 的 一 种 方法 。 顾 名 思 义 ， 对 于 一 个 原 码 来 说 ， 最 左边 的 位 (也 称 
为 高 阶 位 或 最 高 有 效 位 ) 是 符号 位 ， 而 其 余 位 表示 数 的 量 值 (或 绝对 值 ) 。 例 如 ,在 8 位 字 中 ，-1 
表示 为 10000001, ，+1 表示 为 00000001; 。 在 使 用 原 码 表示 的 计算 机 系统 中 ， 用 8 位 存储 整数 ,7 位 
用 于 表示 数 的 量 值 。 这 意味 着 8 位 字 可 以 表示 的 最 大 整数 是 2 - 1 或 127( 最 高 位 是 一 个 0， 后 跟 7 个 
1) 。 最 小 整数 是 11111111; 或 -127。 因 此 ，N 位 可 以 表示 的 范围 是 从 - (20-"” -1) ~2%-7 -1。 

计算 机 必须 能 够 对 用 该 方法 表示 的 整数 执行 算术 运算 。 原 码 运算 基本 上 与 人 用 铅笔 和 纸张 使 
用 的 方法 相同 ， 但 这 种 方法 可 能 很 快 会 让 人 感到 有 些 混乱 。 作 为 示例 ， 考 虑 加 法 规则 : (1) 如 果 
符号 相同 ， 则 数值 相 加 并 使 用 相同 的 符号 作为 结果 ; (2) 如 果 符 号 不 同 ， 则 必须 确定 哪个 操作 数 
具有 较 大 值 。 结 果 的 符号 与 操作 数 中 较 大 数值 的 符号 相同 ， 并 且 数 值 必须 从 较 大 操作 数 减 去 (不 
加 ) 较 小 操作 数 来 获得 。 如 果 你 仔细 考虑 这 些 规则 ， 就 会 知道 这 是 你 手 算 有 符号 数 时 的 方法 。 

我 们 根据 它们 的 符号 以 一 定 的 方式 排列 操作 数 ， 在 不 考虑 符号 的 情况 下 进行 运算 ,然后 在 
计算 完成 后 根据 情况 补 上 符号 。 当 在 一 个 8 位 字 中 按 这 个 想法 建 模 时 ， 我 们 必须 小 心 因 为 结果 
中 只 包括 7 位 ,丢弃 高 阶 位 上 发 生 的 任何 进位 。 

使 用 原 码 运算 ， 计 算 01001111, 加 00100011, 的 结果 。 





1111 寺 进位 
0 OO (79) 
0 OTOO0O0LY (5) 
0 1110010 (114) 


这 个 算术 运算 的 过 程 与 十 进 制 加 法 一 样 ， 包 括 进 位 ， 直 到 得 到 从 右边 数 七 位 的 结果 为 止 。 
如 果 在 这 里 有 一 个 进位 ， 则 我 们 说 有 溢出 情况 并 且 丢 弃 进位 ， 导 致 不 正确 的 和 。 在 此 示例 中 没 
有 溢出 。 

我 们 发 现在 使 用 原 码 表示 时 ，01001111, + 00100011, =01110010,。 | 

符号 位 应 分 开 考虑 ， 因 为 它们 仅 需 在 加 法 完成 后 才 去 处 理 。 在 这 种 情况 下 ， 我 们 得 到 的 是 
两 个 正 数 的 和 ， 这 个 和 是 正 数 。 当 结果 符号 不 正确 时 ， 在 有 符号 数 中 会 发 生 溢出 (因此 产生 错 
误 的 结果 ) 。 

在 原 码 表示 中 ， 符 号 位 仅 用 于 表示 符号 ， 因 此 不 能 进位 至 此 位 。 如 果 第 七 位 发 生 进位 ， 结 
果 将 被 截断 当成 第 七 位 溢出 ， 并 产生 一 个 不 正确 的 和 。( 例 2.11 说 明了 这 种 溢出 情况 。) 只 要 有 


计算 机 系统 中 的 数据 表示 。 4 





最 微小 的 可 能 性 发 生 ， 谨 慎 的 程序 员 都 要 通过 检查 溢出 条 件 避 免 “ 百 万 美元 ”的 错误 。 如 果 
没有 丢弃 溢出 位 ， 它 将 进入 符号 位 ， 导 致 更 无 法 容忍 的 两 个 正 数 之 和 变 为 负数 的 结果 。( 想象 
在 程序 的 下 一 步 中 会 发 生 什么 ， 取 平方 根 或 读 日 志 的 结果 !) 
使 用 原 码 运算 ， 计 算 01001111, 加 01100011, 的 结果 
最 后 的 进位 1 <— [下 和 进位 
溢出 并 被 丢弃 0 1001111 (79) 
O04 LLOO00LL +0 
0 0110010 (50) 


得 到 了 错误 的 结果 是 79 +99 =50。 DS 





尝试 快速 方法 

将 一 个 二 进 制 数 转 换 为 十 进 制 数 的 最 快 方法 是 称 为 倍 和 法 ( double- dabble 或 double- dib- 
ble) 。 这 种 方法 建立 的 基础 是 ,在 二 进 制 数 中 ，2 的 下 一 个 禾 次 是 前 一 个 才 次 的 两 倍 。 计 算 从 
最 左边 的 位 开始 ， 并 移 向 最 右边 的 位 。 第 一 位 被 加 倍 并 加 到 下 一 位 。 然 后 将 该 和 加 倍 并 加 到 下 
一 位 。 对 每 一 位 重复 该 过 程 ， 直 到 最 右边 的 位 。 

例 1 

转换 二 进 制 数 10010011, 为 十 进 制 数 。 

步骤 1: 写 下 二 进 制 数 ， 在 位 与 位 之 间 留 出 空白 


1 0 0 1 0 0 1 1 
步骤 2: 高 阶 位 乘 以 2 并 复制 该 数 到 下 一 位 的 下 方 
] 0 0 1 0 0 1 1 
2 
区 过 
2 
步骤 3: 加 下 一 位 并 对 得 到 的 和 乘 以 2。 复 制 该 结果 到 下 一 位 的 下 方 
1 0 0 1 0 0 1 1 
2 4 
+0 
2 
这 之 6 必 
2 4 
步骤 4: 重复 步骤 3 直到 完成 所 有 位 
] 0 0 0 0 ] 1 


十 
十 


+0 +0 
9 18 36 73 147 熏 结果 : 10010011;=147,。 
2 TE 2 
36 72 146 


当 我 们 将 十 六 进 制 分 组 ( 反 向 ) 与 倍 和 法 结合 时 ， 发 现 可 以 轻松 地 将 十 六 进 制 转换 为 十 进 制 。 





iD 
人 
Oo 
2 








例 2 

将 十 六 进 制 数 02CA,s 转 换 到 十 进 制 。 

首先 ， 把 这 个 十 六 进 制 数 按照 十 六 进 制 分 组 转换 成 二 进 制 数 
0 2 C A 
0000 0010 1100 -1010 


然后 在 二 进 制 形式 上 应 用 倍 和 和 法: 





1 0 1 J 0 0 1 0 1 0 
2 4 10 22 44 88 178 356 714 
+0 + 1 + ] +0 +0 十 ] + 0 + 1 + 0 
2 5 11 22 44 89 178 397 714 
x 2 基业 六 这 关头 之 六 这 2 疾 流 x2 
2 4 10 22 44 88 178 356 714 


02CA,c=1011001010,=714,, 


和 加 法 一 样 ， 原 码 减 法 与 用 笔 和 纸 进行 的 十 进 制 算术 运算 很 类 似 ， 它 有 时 需要 从 被 减 数 上 
借 数 。 
使 用 原 码 运算 ， 计 算 01100011, 减 去 01001111,。 
0112 < : 借 位 
0 1+00811 (99) 
0 TO00lLLI “="(0 
0 0010100 (20) 
我 们 发 现 采 用 原 码 表示 时 ，01100011, -01001111, =00010100,。 4 
使 用 原 码 算法 计算 01001111,(79) 减 去 01100011,(99)。 
通过 检查 ,我 们 看 到 ， 减 数 01100011, 比 被 减 数 01001111; 大 ， 根 据 例 2. 12 得 到 的 结果 我 
们 知道 ， 这 两 个 数字 的 差 是 0010100, 。 由 于 减 数 比 被 减 数 大 ， 所 以 我 们 需要 做 的 是 改变 差 的 符 
号 。 因 此 我 们 发 现 用 原 码 表示 的 结果 是 01001111, -01100011, = 10010100,。 | 
我 们 知道 ,减法 与 “加 上 相反 数 ” 是 一 样 的， 这 相当 于 对 减 数 取 反 然后 用 加 法 代替 减法 
(这 样 做 常常 比 执行 减法 需要 借 位 更 简单 ， 特 别 是 在 处 理 二 进 制 数 时 )。 因 此 ， 我们 需要 看 一 
些 同时 涉及 正 数 和 负数 的 例子 。 回 想 加 法 规则 : (1) 如 果 符 号 是 相同 的 ， 两 个 数 直 接 相 加 ， 结 
果 符 号 是 相同 的 ; (2) 如 果 符 号 不 同 ， 必 须 确定 哪个 数 较 大 ， 结 果 的 符号 是 大 数 的 符号 ， 并且 
结果 应 该 是 大 数 减 去 小 数 ( 不 是 相 加 ) 。 
使 用 原 码 算法 计算 10010011,( -19) 加 00001101,( +13) 
第 一 个 数 是 负数 ， 因 为 它 的 符号 位 是 1， 第 二 个 数 (加 数 ) 是 正 数 ,我们 实际 需要 做 的 是 减 
法 。 首 先 ， 我 们 确定 这 两 个 数 哪个 较 大 ， 并 使 用 较 大 的 数 作为 被 加 数 。 它 的 符号 将 来 就 是 结果 
的 符号 。 





012 < 借 位 
1 00+8811  (-19) 


0 = "O00T10l A413 
1 0000110 (6) 


由 于 包含 符号 位 ， 所 以 我 们 看 到 使 用 原 码 表示 时 的 结果 是 10010011, - 00001101, = 
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10000110,。 4 

全 本 维 合用 原 码 算法 计算 10101011,( -43) 减 去 10011000,( -24)。 

我 们 可 以 用 - ( -24)( 即 24) ， 将 减法 转换 为 加 法 ， 然 后 就 可 以 将 24 加 到 -43 上 了 。 这 样 
就 给 了 我 们 一 个 -43 +24 的 新 间 题 。 然 而 ， 我 们 从 上 面 说 的 加 法 规则 中 知道 ， 因 为 符号 不 同 ， 
所 以 我 们 实际 必须 用 较 大 值 减 去 较 小 值 (或 43 减 去 24) ， 使 结果 为 负 ( 因 为 43 比 24 大 ) 。 

02 

0+01011 (43) 
-0011000- (24) 
0010011 (19) 


请 注意 ， 在 我 们 执行 完 减 法 之 前 ， 不 用 关心 符号 问题 。 我 们 知道 答案 一 定 是 负数 。 所 以 ， 
我 们 最 终 使 用 原 码 表示 为 10101011, - 10011000, = 10010011,。 

阅读 了 前 面 的 例子 后 ， 你 可 能 已 经 注意 到 我 们 不 得 不 问 自 己 的 问题 是 哪个 数 更 大 ? 我 是 否 
减 去 了 负数 ? 我 从 被 减 数 中 借 数 多 少 次 ”以 这 种 方式 执行 算术 运算 的 计算 机 必须 做 出 同样 多 的 
决策 (尽管 速度 更 快 ) 。 由 于 这 个 原 码 0 有 两 种 表示 方式 10000000 和 00000000( 从 数学 上 讲 ， 这 
根本 不 应 该 发 生 ) ， 因 此 逻辑 (和 电路 ) 更 为 复杂 。 用 更 简单 的 方法 表示 有 符号 数 会 使 电路 更 简 
单 而 且 更 便宜 。 这 些 更 简单 的 方法 是 以 基数 补 码 系统 为 依据 的 。 


2.4.2 补 码 系统 

数论 学 家 在 几 百 年 前 就 已 经 知道 从 一 个 十 进 制 数 中 减 去 一 个 数 时 也 可 以 通过 这 个 方法 来 获 
得 ， 即 被 减 数 加 上 9( 位 数 与 被 减 数 相同 ) 与 每 位 减 数 的 差 并 加 回 一 个 进位 。 这 称 为 获得 了 减 数 
9 的 补 码 ， 或 者 更 正式 的 说 法 是 ， 找 到 基数 减 一 的 补 码 。 比 方 说 ， 我 们 想 求解 167 - 52 的 结果 。 
已 知 999 -52 =947。 根 据 9 的 补 码 运算 ， 我 们 有 167 -52 =167 +947 =1114。 来 自 百 位 的 “ 进 
位 ”加 回 到 数据 中 ， 就 得 到 一 个 正确 的 结果 167 - 52 =115。 这 种 方法 已 经 扩展 到 二 进 制 操作 
中 以 简化 计算 机 的 运算 。 我 们 处 理 原 码 时 补 码 系统 带 给 的 好 处 是 ， 没 有 必要 单独 处 理 符 号 位 ， 
但 我 们 仍然 可 以 很 容易 地 通过 观察 其 高 阶 位 ， 检 查 数 的 符号 。 

将 补 码 系统 的 另 一 种 方法 想象 成 一 辆 自行 车 上 的 里 程 表 。 不 同 于 汽车 ， 当 自行 车 倒退 时 ， 
里 程 表 也 会 倒退 。 假 设 里 程 表 有 3 位 数字 ， 如 果 从 0 开始 ， 并 到 700mile( lmile = 1609. 344m ) 结 
束 ， 我 们 不 能 确定 自行 车 是 前 进 了 700mile 还 是 后 退 了 300mile! 这 一 难题 最 简单 的 解决 方法 是 
把 数 的 范围 削减 一 半 ， 并 使 用 001 ~ 500 为 正 英 里 ，501 ~ 999 为 负 英里 。 实 际 上 ， 我 们 减少 了 
里 程 表 可 以 测量 的 距离 。 但 现在 如 果 它 的 读数 为 997， 那 么 我 们 知道 自行 车 是 向 后 走 了 3mile 
而 不 是 向 前 走 了 997mile。 数 字 501 ~ 999 表示 001 ~ 500 的 基数 补 码 (下 面 介绍 两 种 方法 中 的 第 
二 种 ) ， 并 用 于 表示 负 距 离 的 数字 。 

1 的 补 码 

如 上 所 述 ， 在 以 10 为 基 的 数 中 ， 一 个 数字 的 基数 减 一 的 补 码 是 从 基数 减 1( 即 十 进 制 中 的 9) 
中 减 去 减 数 得 到 的 。 更 加 形式 化 的 表述 方式 为 : 给 定 一 个 具有 d 位 数字 且 基 数 为 的 数字 NW，N 
的 基数 减 一 的 补 码 定 义 为 (上 -1) -N。 对 于 十 进 制 数 ,，r =10， 基 数 减 一 是 10 -1 =9。 例 如 ，2468 
的 9 的 补 码 为 9999 -2468 =7531。 对 于 二 进 制 的 等 价 运 算 ， 我 们 从 一 个 较 小 的 基数 2 中 减 去 1， 得 
到 1。 例如 ，0101, 的 1 的 补 码 是 1111, -0101, = 1010,。 如 上 所 述 我 们 可 以 乏味 地 借 位 做 减法 ， 但 
是 一 些 实验 会 说 服 你 产生 一 个 二 进 制 数 的 1 的 补 码 ( 译 者 注 : 二 进 制 数 的 1 的 补 码 一 般 称 为 反 码 ) ， 
只 需要 把 所 有 的 1 换 成 0， 所 有 的 0 换 成 1。 这 种 二 进 制 位 翻转 在 计算 机 硬件 中 实现 起 来 非常 简单 。 

在 这 一 点 上 值得 注意 的 是 ， 虽 然 我 们 可 以 找到 任何 十 进 制 数 的 9 的 补 码 或 任何 二 进 制 数 的 
1 的 补 码 ， 但 是 我 们 最 感 兴趣 的 是 使 用 补 码 表示 法 来 表示 负数 。 我 们 知道 执行 一 个 减法 时 ， 如 








10 -7， 也 可 以 考虑 像 10 + ( -7) 这 样 “ 加 上 负数 "。 补 码 表示 法 允许 我 们 把 减法 变 为 加 法 来 简 
化 减法 ， 另 一 方面 也 给 了 我 们 一 个 表示 负数 的 方法 。 因 为 我 们 不 希望 使 用 一 个 特殊 位 来 表示 符 
号 (正如 我 们 在 原 码 表 示 中 所 做 的 那样 ) 。 我 们 需要 记 住 ， 如 果 一 个 数 是 负数 ， 那 么 应 该 将 它 
转换 为 它 的 补 码 。 结 果 应 该 在 最 左边 的 位 上 有 一 个 1， 表 示 这 个 数字 是 负数 。 
虽然 一 个 数 的 1 的 补 码 严格 地 说 是 用 2 的 寡 减 1 再 减 去 那个 数 得 到 的 ， 但 是 我 们 经 常 把 对 
负数 使 用 1 的 补 码 的 计算 机 称 为 1 的 补 码 系统 ， 或 使 用 1 的 补 码 运算 的 计算 机 。 这 可 能 有 点 误 
导 ， 因 为 正 数 不 需 要 补 码 。 我 们 只 对 负数 求 补 码 ， 所 以 可 以 把 它们 变 成 计算 机 能 理解 的 格式 。 
例 2.16 阐述 了 这 些 概 念 。 
(汪汪 BB 用 8 位 二 进 制 表示 23,, 和 -9,,， 假 设 一 台 计 算 机 使 用 1 的 补 码 表示 。 
23,, = + (00010111,) = 00010111， 
-9 =— (00001001,) = 11110110， < 
与 原 码 不 同 ， 在 1 的 补 码 加 法 中 没有 必要 使 符号 位 与 其 他 位 分 离 。 符 号 由 自己 保管 。 将 例 
2. 17 与 例 2. 10 进行 比较 。 
使 用 1 的 补 码 加 法 计算 01001111, 加 00100011,。 
1111 < 二 进位 
01001111 (79) 
+00100011 + (35) 
OLLLOMLO (Li4) | 
假设 我 们 希望 从 23 中 减 去 9。 为 了 执行 一 个 1 的 补 码 减 法 ， 我 们 首先 用 1 的 补 码 表示 减 数 
(9) ， 然 后 将 它 加 到 被 减 数 (23 ) 上， 我 们 现在 实际 上 是 将 -9 与 23 相 加 。 高 阶 位 将 有 一 个 1 或 
0 的 进位 ， 这 个 进位 加 到 低 阶 位 。( 这 就 是 所 谓 的 尾 进 位 循环 和 使 用 基数 减 一 的 补 码 的 结果 。) 
CV 汗 B 使 用 1 的 补 码 运算 ， 计 算 23 加 -9。 


二 二 进位 





00010111 (23) 
4 TLTIOLLIO FA 
00001101 
最 后 的 进位 +1 
加 到 总 和 中 00001110 141o 通 


使 用 1 的 补 码 运算 , 计算 9% 加 一 23,,。 


最 后 的 进位 0 二 00001001 (9) 
是 0， 所 以 4 TELOLOOO Ss C23) 
计算 结束 Lid <4 = 


我 们 怎么 知道 11110001, 实 际 上 是 - 14? 我 们 只 需要 求 这 个 二 进 制 数 的 1 的 补 码 ( 记 住 它 
必须 是 负数 ， 因 为 最 左边 的 位 是 负 的 )。11110001, 的 1 的 补 码 是 00001110;， 它 是 14。 

1 的 补 码 的 主要 缺点 是 我 们 仍然 要 有 两 个 表示 为 零 的 数 : 00000000, 和 11111111,。 由 于 这 
个 原因 和 其 他 原因 ， 计算 机 工程 师 早已 不 再 使 用 1 的 补 码 了 ， 而 是 使 用 更 有 效 的 2 的 补 码 以 表 
示 二 进 制 数 。 

2 的 补 码 

2 的 补 码 是 基数 补 码 的 一 个 例子 。 给 定 一 个 数字 N， 它 的 基数 为 -， 具 有 4 位 数字 ，N 的 基 
数 补 码 定义 为 : 当 N=0 时 为 0，N 关 0 时 为 rN。 基数 补 码 通常 比 基 数 减 一 的 补 码 更 直观 。 
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使 用 我 们 的 里 程 表 的 示例 ， 前 进 2mile 的 10 的 补 码 是 10’ - 2 =998， 我 们 已 经 商定 了 这 个 距离 
是 指 负 (向 后 ) 距离 。 同 样 ， 在 二 进 制 中 , 4 位 二 进 制 数 0011, 的 2 的 补 码 为 2 -0011, = 
10000, -0011, = 1101,。 
仔细 观察 你 会 发 现 ，2 的 补 码 仅 比 1 的 补 码 多 1。 因 此 , 求解 二 进 制 数 的 2 的 补 码 只 需要 
将 二 进 制 数 的 各 位 取 反 ， 然 后 末 位 加 1 即 可 。 这 大 大 简化 了 加 法 和 减法 运算 。 因 为 减 数 ( 求 补 
和 加 的 数字 ) 是 在 一 开始 增加 的 ， 而 且 没有 尾 进 位 循环 的 担心 。 我 们 可 以 简单 地 丢弃 涉及 高 阶 
位 的 任何 进位 。 和 1 的 补 码 一 样 ，2 的 补 码 也 是 一 个 数 的 补 码 ， 而 使 用 这 种 表示 法 来 表示 负数 
的 计算 机 被 称 为 2 的 补 码 系统 ， 或 称 为 使 用 2 的 补 码 运算 。( 译 者 注 : 二 进 制 数 的 2 的 补 码 一 
般 称 为 补 码 )。 和 以 前 一 样 ， 正 数 可 以 单独 列 出 来 ; 我 们 只 需要 对 负数 求 补 使 它们 变 成 2 的 补 
码 形式 。 例 2.20 阐述 了 这 些 概念 。 
假设 一 台 计 算 机 使 用 2 的 补 码 表 示 ， 把 23,、-23w 和 -9 表示 为 8 位 二 进 制 数 。 
23,,=+ (00010111,) = 00010111， 
—2310=— (00010111,) = 11101000,+1=11101001， 


-9io= - (00001001,)= 11110110;+1=11110111， 本 


因为 正 数 在 1 的 补 码 表示 和 2 的 补 码 表示 中 是 相同 的 (以 及 在 原 码 中 ) ， 因 此 两 个 正 的 二 进 
制 数 相 加 的 过 程 相 同 。 将 例 2. 21 与 例 2. 17 和 例 2. 10 进行 比较 。 
到 使 用 2 的 补 码 加 法 ， 计 算 01001111, 加 00100011 ,的 结果 。 


1111 <= 进位 

01001111 (79) 

00100011 + (35) 
所 OILITOGLIO 《L140 4 


假设 我 们 给 出 一 个 以 二 进 制 表示 的 数字 ， 并 想 知道 其 等 价 的 十 进 制 数 。 这 对 正 数 是 很 容易 
的 。 例 如 ， 要 转换 2 的 补 码 值 00010111, 到 十 进 制 ， 我 们 只 需 转 换 这 个 二 进 制 数 字 到 十 进 制 数 ， 
结果 是 23。 但 是 ， 转 换 负 数 的 2 的 补 码 值 过 程 与 把 十 进 制 转 换 到 二 进 制 的 逆 过 程 类 似 。 假 设 我 
们 给 出 了 2 的 补 码 值 为 11110111,， 我们 想 知道 等 价 的 十 进 制 数值 。 我 们 知道 这 是 一 个 负数 ， 
但 必须 记 住 它 是 使 用 2 的 补 码 表示 的 。 我 们 首先 翻转 这 些 位 ， 然 后 再 加 1( 找 到 1 的 补 码 并 加 
1)。 这 个 结果 如 下 : 00001000, +1 =00001001,。 这 等 同 于 十 进 制 值 9。 但 是 ， 开 始 的 原始 数字 
是 负数 ， 所 以 我 们 最 终 使 用 9 作为 等 价 于 11110111, 的 十 进 制 数 。 

以 下 两 个 示例 说 明 如 何 使 用 2 的 补 码 表示 法 执行 加 法 (减法 同 理 ， 因 为 减 去 一 个 数字 是 加 
上 它 的 负数 ) 。 

使 用 2 的 补 码 运算 ， 计 算 9 加 -23, 的 结果 。 








00001001 (9) 
+ LTLOLOOL +. :C23) 
11110010 =]4 本 


留 给 你 一 个 练习 ， 验 证 11110010, 实 际 上 是 使 用 2 的 补 码 表 示 的 -14，。 
使 用 2 的 补 码 运算 ， 求 解 用 二 进 制 表示 的 23 ,与 -9 ,的 和 。 
1 有 浊 售 
本国 国 | (23) 


丢弃 进位 + 11101111 + _(C9) 
00001110 l4'0 > 





在 2 的 补 码 中 ， 两 个 负数 相 加 会 产生 一 个 负数 结果 ， 就 像 我 们 所 期 望 的 那样 。 
使 用 2 的 补 码 加 法 运算 , 求 11101001,( -23) 与 11110111,( -9) 的 和 。 


1 -~ 内 伍 

11101001  (-23) 

丢弃 进位 + 11110111 + (-9) 
11100000  (-32) 和 


注意 在 例 2. 23 和 例 2.24 中 丢弃 进位 没有 导致 错误 的 结果 。 如 果 两 个 正 数 相 加 并 且 和 是 负 
数 ， 或 者 如 果 两 个 负数 相 加 并 且 结 果 为 正 ， 则 会 发 生 溢出 。 当 使 用 2 的 补 码 表 示 法 时 ， 如 果 一 
个 正 数 和 一 个 负数 相 加 ， 不 可 能 发 生 溢出 。 


整数 的 乘法 和 除法 





除非 使 用 复杂 的 算法 ,否则 乘法 和 除法 运算 在 获得 结果 之 前 会 消耗 相当 多 的 计算 周期 。 在 
这 里 ， 我 们 只 讨论 执行 这 些 操作 最 直接 的 方法 。 现 实 系统 中 ， 专 用 硬件 用 于 优化 吞吐 量 ， 有 时 
并 行 执行 部 分 计算 。 好 奇 的 读者 可 能 会 想 研究 在 本 章 结 尾 参 考 文献 中 的 一 些 更 优 的 方法 。 

计算 机 使 用 的 最 简单 的 乘法 运算 类 似 于 人 类 使 用 的 传统 的 用 铅笔 和 纸 进 行 运 算 的 方法 。 二 进 
制 数 的 完全 乘法 表 不 能 更 简单 了 : 0 乘 以 任何 数 结果 都 为 0， 以 及 1 乘 以 任何 数 结果 还 是 那个 数 。 

为 了 说 明 简 单 的 计算 机 乘法 ,我 们 首先 将 被 乘 数 和 乘 数 写 入 两 个 单独 的 存储 区 域 。 还 需要 第 
三 个 放 结果 的 存储 区 域 。 从 低位 开始 ， 指 针 设置 为 乘 数 的 每 个 数字 。 对 于 乘 数 中 的 每 个 数字 ， 被 
乘 数 向 左 “ 移 位 ”一 位 。 当 乘 数 为 1 时 ,“ 移 位 ”的 被 乘 数 加 到 部 分 乘积 的 累加 和 中 。 因 为 对 于 
乘 数 中 的 每 一 位 ， 被 乘 数 都 需要 移动 一 位 ， 所 以 乘 数 、 被 乘 数 和 结果 都 需要 双 精 度 的 工作 空间 。 

执行 二 进 制 除法 有 两 种 简单 的 方法 : 既 可 以 迭代 地 从 被 除数 中 减 去 分 母 ， 也 可 以 使 用 与 小 
学 学 的 长 除法 相同 的 试 错 法 。 与 乘法 一 样 ， 对 于 二 进 制 除法 最 有 效 的 方法 超出 了 本 书 范围 ， 读 
者 可 以 在 本 章 末 尾 的 参考 文献 中 找到 。 

不 管 使 用 的 算法 相对 效率 如 何 ， 除 法 总 是 会 导致 计算 机 崩溃 的 操作 。 当 尝试 除 以 零 或 当 两 
个 数值 相差 极 大 的 数 作为 操作 数 时 ， 情 况 更 特别 。 当 除数 远 远 小 于 被 除数 时 ， 我 们 会 看 到 一 个 
称 为 除法 下 洲 的 情况 ， 即 计算 机 将 这 种 情况 视 为 除数 等 于 0， 这 是 不 可 能 的 。 

计算 机 可 以 区 分 整数 除法 和 浮 点 数 除法 。 整 数 除法 的 结果 分 为 两 部 分 : 商 和 余数 。 浮 点 数 
除法 产生 一 个 用 二 进 制 表示 的 小 数 。 在 这 两 种 类 型 的 除法 之 间 有 着 明显 的 不 同 ， 因 此 每 种 除法 
都 需要 自己 的 特殊 电路 。 浮 点 计算 是 在 名 为 浮 点 单元 (FPU) 的 专用 电路 中 进行 的 。 

例 求解 00000110, 和 00001011, 的 乘积 。 


被 乘 数 部 分 乘积 
+ 加 被 乘 数 并 左 移 
+ 加 被 乘 数 并 左 移 
+ 不 加 ， 只 左 移 被 乘 数 
+ 加 被 乘 数 
= [ol lololofofTo] 











简单 的 计算 机 电路 可 以 使 用 很 容易 记 住 的 规则 检测 溢出 情况 。 在 例 2. 23 和 例 2. 24 中 你 会 
注意 到 ， 进 入 符号 位 的 进位 (一 个 1 从 前 一 个 位 置 进 位 到 符号 位 的 位 置 ) 与 出 符号 位 的 进位 (一 
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个 1 从 符号 位 出 并 丢弃 ) 是 相同 的 。 当 这 些 进位 相等 时 ， 不 发 生 溢出 。 当 它们 不 同时 ， 在 算术 
逻辑 单元 中 的 溢出 指示 器 被 置 位 ， 表 示 结 果 不 正确 。 

检测 有 符号 数 运算 是 否 存在 溢出 的 简单 规则 : 如 果 进 符号 位 的 进位 等 于 出 符号 位 的 进位 ， 
则 无 溢出 。 如 果 两 者 不 同 ， 出 现 溢出 (从 而 出 现 错误 ) 。 

最 难 的 是 让 程序 员 ( 或 编译 器 ) 来 持续 检查 溢出 情况 。 例 2. 25 表示 有 溢出 ， 因 为 进 符号 位 
的 进位 ( 即 进来 一 个 1) 不 等 于 出 符号 位 的 进位 ( 即 出 去 一 个 0)。 

全 本 多 使 用 2 的 补 码 运 算 , 求解 1261, 与 84 的 二 进 制 之 和 。 


Oe TT 对 进位 

DOLLLELLLO (12 6) 

丢弃 最 后 + 00001000 + (8) 
一 个 进位 10000110 ‘(=122327) 


一 个 1 被 进位 到 最 左边 的 位 中 ,但 是 从 这 一 位 出 来 的 进位 是 一 个 0。 因 为 这 些 进位 不 相等 ， 
所 以 发 生 了 溢出 。( 我 们 可 以 很 容易 地 看 到 两 个 正 数 相 加 ， 但 结果 却 是 负 的 。) 我 们 回 到 2. 4.6 
节 的 这 个 主题 。 4 

2 的 补 码 是 表示 有 符号 数 的 最 普遍 选择 。 这 个 算法 对 加 法 和 减法 都 相当 容易 ， 对 于 0 它 有 
最 好 的 表示 (全 0 位 )， 是 自 反 相 的 ， 并 且 容 易 扩展 到 更 多 的 位 。 最 大 的 缺点 是 在 由 N 位 表示 
的 取 值 范围 内 可 看 到 不 对 称 性 。 例 如 ,4 位 使 用 原 码 的 数 允 许 表示 的 值 为 -7 ~ +7。 但 是 , 使 
用 2 的 补 码 可 以 表示 的 值 为 -8 ~ +7， 这 通常 会 使 学 习 补 码 表示 的 人 很 混乱 。 要 了 解 为 什么 + 
7 是 使 用 4 位 2 的 补 码 表示 的 最 大 数 ， 只 需要 记 住 第 一 位 必须 是 0。 如果 剩 余 的 位 都 是 1( 可 能 
的 最 大 数值 ) ， 我 们 得 到 0111, ， 这 就 是 7。 对 此 的 立即 反应 是 最 小 的 负数 应 该 是 1111: ， 但 可 
以 看 到 1111, 实 际 上 是 -1( 翻转 位 ， 加 1， 并 使 数字 为 负 ) 。 那 么 我 们 如 何 用 4 位 二 进 制 数 的 2 
的 补 码 表示 -8 呢 ? 它 应 表示 为 1000,。 我 们 知道 这 是 一 个 负数 。 如 果 我 们 翻转 位 (0111)， 再 
加 1( 得 到 1000， 这 就 是 8) ， 并 使 其 为 负 ， 我 们 得 到 -8。 


2.4.3 有 符号 数 的 移 码 表示 


回顾 在 介绍 补 码 系统 时 讨论 的 自行 车 示例 。 我 们 选择 一 个 特定 的 值 (500 ) 作为 正 英 里 的 最 
大 值 ， 我 们 分 配 值 从 501 ~ 999 表示 负 英 里 。 不 需要 符号 ， 因 为 我 们 使 用 范围 来 确定 数字 是 正 
数 还 是 负数 。 偏 移 值 为 M 的 移 码 表示 (也 称 为 偏 移 二 进 制 表示 ) 与 做 某 些 事 非常 相似 ; 无 符号 
二 进 制 数值 用 于 表示 有 符号 整数 。 然 而 ， 与 原 码 和 补 码 编码 不 同 ， 偏 移 值 为 M 的 移 码 表示 更 
直观 ， 因 为 具有 全 0 的 二 进 制 数字 串 表 示 最 小 的 数字 ， 而 具有 全 1 的 二 进 制 数字 串 表 示 最 大 
值 。 换 句 话说， 这 保留 了 数 的 顺序 。 

使 用 整数 W( 称 为 偏 移 值 ) 的 无 符号 二 进 制 数值 代表 值 0， 而 位 模式 中 的 全 零 代 表 整 数 - M。 
基本 上 ， 十 进 制 整数 “映射 ”( 如 我 们 的 自行 车 示例 ) 为 无 符号 二 进 制 整数 ,但 根据 它 所 落 的 范 
围 ， 解释 为 正 或 负 。 如 果 我 们 使 用 n 位 二 进 制 表 示 ， 那 么 需要 用 等 范围 的 分 割 方式 选择 这 个 偏 移 
值 。 我 们 通常 选择 2"“ -1 作为 偏 移 值 。 例 如 ， 如 果 我 们 使 用 4 位 二 进 制 表示 ， 偏 移 值 应 该 是 
2 -1=7。 和 原 码 、1 的 补 码 和 2 的 补 码 一 样 ，n 位 二 进 制 所 能 表示 的 值 有 一 个 特定 的 范围 。 

把 一 个 有 符号 整数 用 偏 移 值 为 M 的 移 码 表示 法 表示 为 无 符号 二 进 制 值 ， 只 需 简 单 地 将 M 
加 到 该 整数 上 。 例 如 ， 假 设 我 们 使 用 偏 移 值 为 7 的 移 码 表 示 法 ， 整 数 0 将 表示 为 0+7=7io = 
0111,; 整数 3 将 表示 为 3+7 =10,,。=1010,; 整数 -7 将 表示 为 -7+7=0,。=0000,。 使 用 偏 移 
值 为 7 的 移 码 表示 法 并 给 定 二 进 制 数 1111, ， 找 到 它 表 示 的 十 进 制 值 ， 我 们 只 需 简 单 地 减 去 7: 
1111 =15,。， 并 且 15 -7=8。 因 此 ，1111, 使 用 偏 移 值 为 7 的 移 码 表示 法 表示 的 值 为 + 81。 

让 我 们 比较 一 下 到 目前 为 止 已 经 看 到 过 的 编码 方案 ,假设 有 8 位 数字 : 


50 第 2 章 



















整数 二 进 制 字 符 串 表示 有 符号 整数 
十 进 制 | 二进制 (绝对 值 ) | 原 码 | 1 的 补 码 2 的 补 码 偏 移 值 为 127 的 移 码 
2 00000010 00000010 00000010 00000010 10000001 
-2 00000010 10000010 | 11111101 il 01111101 








01100100 
01100100 


01100100 
11100100 





01100100 
10011011 





01100100 
10011100 






11100011 
00011011 











偏 移 值 为 W 的 移 码 表示 允许 我 们 使 用 无 符号 二 进 制 值 来 表示 有 符号 整数 ; 但 重要 的 是 ， 
必须 指定 两 个 参数 : 表示 法 中 使 用 的 位 数 和 偏 移 值 。 此 外 ， 计 算 机 不 能 使 用 为 无 符号 数 设计 的 
硬件 对 偏 移 值 为 W 的 移 码 执行 加 法 运算 ， 这 需要 使 用 特殊 的 电路 。 偏 移 值 为 W 的 移 码 表示 法 
很 重要 ， 因 为 在 浮 点 数 中 它 用 于 表示 整数 指数 ,我 们 将 在 2.5 节 中 看 到 。 


2. 4.4 无 符号 数 与 有 符号 数 

我 们 讨论 了 无 符号 的 二 进 制 整数 。 无 符号 数 用 于 表示 保证 不 为 负数 的 值 。 它 的 一 个 很 好 的 
例子 是 存储 器 地 址 。 如 果 4 位 二 进 制 值 1101 是 无 符号 的 ,那么 它 表 示 十 进 制 值 13 ， 但 是 作为 
一 个 使 用 2 的 补 码 表示 的 有 符号 数 ， 它 代表 -3。 有 符号 数字 用 于 表示 可 以 为 正 或 负 的 数 。 

计算 机 程序 员 必 须 能 够 管理 有 符号 数 和 无 符号 数 。 为 此 ， 程 序 员 必 须 首先 识别 有 符号 数 或 
无 符号 数 的 数值 。 这 是 通过 将 值 声明 为 特定 类 型 来 实现 的 。 例 如 ，C 编程 语言 有 int 和 
unsigned int 作为 可 能 的 整数 变量 类 型 ， 分 别 定 义 有 符号 和 无 符号 整数 。 除 了 不 同类 型 的 声 
明 ， 许 多 语言 对 于 有 符号 和 无 符号 数字 具有 不 同 的 算术 运算 。 一 种 语言 可 能 有 一 个 用 于 有 符号 
数 的 减法 指令 和 一 个 用 于 无 符号 数 的 减法 指令 。 在 大 多 数 汇编 语言 中 ， 程 序 员 可 以 选择 有 符号 
的 比较 运算 符 或 无 符号 的 比较 运算 符 。 

当 我 们 试图 存储 对 于 特定 位 数 来 说 太 大 的 值 时 ， 比 较 无 符号 数 和 有 符号 数 会 发 生 什 么 是 很 
有 趣 的。 无 符号 数 简单 地 循环 并 从 零 开始 。 例 如 ， 如 果 使 用 4 位 无 符号 二 进 制 数 ， 把 1 加 到 
1111 上 ， 得 到 0000。 对 于 这 种 “返回 零 ” 的 情况 我 们 是 很 熟悉 的 ， 也 许 你 曾经 在 一 辆 跑 了 很 
多 里 程 的 汽车 上 见 过 ， 它 的 里 程 表 又 回 到 了 有 零 。 但 是 ， 有 符号 数 分 配 一 半 的 空间 用 于 正 数 ， 另 
一 半 用 于 负数 。 如 果 我 们 将 1 加 到 最 大 正 的 4 位 2 的 补 码 数 0111( +7) ， 得 到 1000( -8)。 符 
号 的 意外 改变 对 于 没有 经 验 的 程序 员 来 说 是 有 问题 的 ， 这 将 导致 数 小 时 的 调试 时 间 。 好 的 程序 
员 明 白 这 种 情况 ， 在 发 生 之 前 会 做 出 适当 计划 去 处 理 这 个 情况 。 


2.4.5 计算 机 、 算 术 和 布 斯 算法 


本 章 介 绍 的 计算 机 算术 可 能 看 起 来 很 简单 、 直 接 ， 但 它 在 计算 机 体系 结构 中 是 一 个 主要 的 
研究 领域 。 主 要 重点 是 对 可 以 在 软件 、 固 件 或 硬件 中 实现 的 算术 函数 的 实现 。 这 个 领域 的 研究 
人 员 正 在 设计 更 高 级 的 中 央 处 理 单元 、 开 发 高 性 能 算术 电路 以 及 为 能 入 式 系统 特定 应 用 电路 领 
域 做 出 贡献 。 他 们 正在 研究 算法 和 新 的 硬件 以 实现 快速 加 法 、 减 法 、 乘 法 和 除法 ， 以 及 快速 浮 
点 运算 。 人 研究 人 员 正 在 寻找 使 用 非 传 统 方法 的 方案 ， 如 快速 先行 进位 原理 、 剩 余 算 术 和 布 斯 算 
法 。 布 斯 算法 是 一 个 这 样 的 好 例子 ， 在 有 符号 的 2 的 补 码 数 情境 下 ， 它 给 你 一 个 如 何 通过 巧妙 
的 算法 增强 一 个 简单 算术 运算 的 概念 。 

当 乘 以 一 个 用 2 的 补 码 表示 的 数 时 ， 虽 然 布 斯 算法 通常 会 提高 性 能 ， 但 我 们 有 引入 该 算法 
的 另 一 个 动机 。 在 2.4.2 节 中 ,我 们 介绍 了 2 的 补 码 的 例子 并 且 看 到 这 个 数 可 以 当 作 无 符号 
数 。 我 们 只 需 执行 “常规 ”加 法 ， 如 下 例 所 示 : 

1001 ( -7) 
+ 0011 (+3) 
1100 ( -4) 
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对 于 2 的 补 码 执行 减法 操作 也 是 如 此 。 但 是 ， 现 在 考虑 用 铅笔 和 纸 计 算 一 下 用 2 的 补 码 表 
示 的 数 标准 的 乘法 过 程 : 
区 
x Ti00 (有 
0000 
0000 
1011 
1011 
10000100 (-124) 


“常规 ”乘法 明显 地 产生 了 不 正确 的 结果 。 对 于 这 个 问题 有 许多 种 解决 方案 ， 如 将 两 个 值 
转换 为 正 数 ， 执 行 常 规 乘法 ， 然 后 记 住 是 一 个 还 是 两 个 数 为 负数 ， 以 确定 结果 是 正 还 是 负 。 布 
斯 算法 不 仅 解决 了 这 个 困境 ， 而 且 还 加 速 了 乘法 进程 。 

布 斯 算法 的 一 般 思路 是 当 乘 数 中 存在 连续 的 0 或 1 时 ， 乘 法 的 速度 会 加 快 。 容 易 看 到 连续 
的 0 能 提高 性 能 。 例 如 ， 如 果 我 们 使 用 经 过 考验 的 手 算 方 法 ， 发 现 计 算 978 x 1001 比 计算 
978 x 999 更 容易 。 这 是 因为 在 1001 中 有 两 个 零 。 但 是 ， 如 果 重 写 这 两 个 问题 如 下 所 示 : 

978 x 1001 = 978 x (1000 +1) = 978 x 1000 + 978 
978 x 999 = 978 x (1000 -1) = 978 x 1000 ~ 978 
就 可 以 看 到 这 两 个 问题 事实 上 在 难度 上 是 相等 的 。 

我 们 的 目标 是 利用 以 二 进 制 数 表示 的 一 串 数字 的 优势 ， 这 与 使 用 一 串 0 的 优势 大 致 相同 。 
我 们 可 以 使 用 上 面 的 重 写 方法 。 例 如 ， 二 进 制 数 0110 可 以 被 重 写 为 1000 - 0010 = - 0010 + 
1000。 这 两 个 数 被 替换 为 一 个 ”- ”( 由 字符 串 中 最 右边 的 1 决定 )， 后 跟 一 个 “+”( 由 字符 
串 中 最 左边 的 1 向 左 移动 一 个 位 置 来 确定 ) 。 


考虑 下 面 的 标准 乘法 示例 : 
0011 
x 0110 
+ 0000 “在 乘 数 中 0 表示 简单 移 位 ) 
+ 0011 (在 乘 数 中 1 表示 加 被 乘 数 并 移 位 ) 
+ 0011 (在 乘 数 中 1 表示 加 被 乘 数 并 移 位 ) 
+ 0000 (在 乘 数 中 0 表示 简单 移 位 ) 
00010010 


布 斯 算法 的 想法 是 当 我 们 看 到 一 串 1 最 右边 的 1 时 用 减法 替换 乘 数 中 的 一 串 1( 或 减 去 
0011) ， 随 后 为 一 串 1 最 左边 的 1 之 后 的 位 加 工 (或 加 001100 ) 。 对 于 一 串 1 的 中 间 位 ,我 们 现 
在 可 以 使 用 简单 的 移 位 : 

0011 
x 0110 
+ 0000 ”( 在 乘 数 中 0 表示 简单 左 移 ) 
= O01 ( 在 乘 数 中 第 一 个 1 表示 减 被 乘 数 并 移 位 ) 
+ 0000 (两 个 1 中 间 的 数字 串 表示 移 位 ) 
+ 0011 (上 一 步 中 已 有 一 个 1 所 以 加 到 被 乘 数 上 ) 
00010010 


在 布 斯 算法 中 ， 如 果 被 乘 数 和 乘 数 都 是 n 位 2 的 补 码 数 ， 那 么 结果 是 一 个 22 位 2 的 补 码 





数 。 因 此 ， 当 我 们 执行 中 间 步 又 时 ， 必 须 将 n 位 数字 扩展 到 2n 位 。 如 果 需 要 扩展 的 数字 是 负 
数 ， 那 么 我 们 必须 扩展 符号 。 例 如 ， 值 1000,( -8) 扩 展 到 8 位 将 是 11111000,。 我 们 连续 操作 
乘 数 中 的 位 ， 完 成 一 个 步骤 移 位 一 次 。 但 是 ,我 们 感 兴趣 的 是 乘 数 中 的 位 对 ， 并 根据 以 下 规则 
进行 操作 

1. 如 果 当 前 乘 数位 为 1 且 前 一 位 为 0， 则 我 们 处 于 数字 串 1 的 开始 位 置 ， 因 此 从 乘积 中 减 
去 被 乘 数 (或 加 上 对 应 的 负数 ) 。 

2. 如 果 当 前 乘 数位 为 0 且 前 一 位 为 1， 则 我 们 处 于 数字 串 1 的 末尾 位 置 ， 因 此 将 被 乘 数 加 
到 乘积 中 。 

3. 如 果 它 是 一 对 00 或 一 对 11 ， 则 不 执行 算术 运算 (处 在 数字 串 0 或 数字 串 1 的 中 间 ) ， 只 
需 移动 。 这 个 算法 的 优势 就 在 这 一 步 : 我 们 现在 可 以 把 数字 串 1 当 作 数 字 串 0 来 看 待 ， 除 了 移 
位 不 做 任何 事情 。 

注意 : 第 一 次 在 乘 数 中 选择 一 个 位 对 时 ， 我 们 应 该 假设 一 个 虚构 的 0 为 “前 一 个 ”位 。 然 
后 我 们 简单 地 向 左 移动 一 位 作为 下 一 对 。 

例 2. 26 说 明了 使 用 布 斯 算法 和 带 符号 的 4 位 2 的 补 码 ， 计 算 乘 法 -3 x5 的 过 程 。 

在 4 位 2 的 补 码 中 ，-3 表示 为 1101,。 扩 展 至 8 位 变 为 11111101,。 它 的 补 码 是 
00000011, 。 当 我 们 看 到 在 乘 数 中 最 右边 的 1 时 ， 它 是 一 个 数字 串 1 的 开头 ， 所 以 把 它 看 作 数 字 
串 10 

1101 “(对 于 减法 ， 加 -3 的 补 码 或 00000011, ) 
x 0101 

+ 00000011 (10= 减 1101= 加 00000011) 

+ 11111101 (把 11111101 加 到 乘积 上 一 一 注意 符号 扩展 ) 
+ 00000011 (10= 减 1101= 加 00000011) 
+ 11111101 (01 = 把 被 乘 数 11111101 加 到 乘积 上 ) 
100111110001 ( 使 用 最 右边 8 位 ， 得 到 -3 x 5 =-15 ) 
Cs 


忽略 超出 2n 的 扩展 符号 位 < 
让 我 们 来 看 53 x 126 这 个 更 大 的 例子 : 


00110101 (对 于 减法 ， 加 53 的 补 码 或 11001011 ) 
x 01111110 
+ 0000000000000000 ”(00= 简单 移 位 ) 
+ 111111111001011 (10= 减 法 = 加 11001011， 扩展 符号 ) 
+ 00000000000000 (11= 简单 移 位 ) 


+ 0000000000000 (11 = 简单 移 位 ) 
+ 000000000000 (11 = 简单 移 位 ) 
+ 00000000000 (11 = 简单 移 位 ) 
+ 0000000000 (11 = 简单 移 位 ) 
+ 000110101 (01 = 加 法 ) 
10001101000010110 (53 x 126= 6678 ) 4 


注意 ， 我 们 没有 显示 超出 需要 的 扩展 符号 位 并 且 只 使 用 了 最 右边 的 16 位 。 在 乘 数 中 整个 1 
的 数字 串 被 一 个 减法 (加 11001011 ) 后 跟 一 个 加 法 所 蔡 换 。 在 中 间 要 做 的 只 是 简单 移 位 ， 移 位 
对 计算 机 来 说 很 容易 (我 们 将 在 第 3 章 中 看 到 ) 。 如 果 计 算 机 执行 加 法 所 需 的 时 间 比 移 位 所 需 的 
时 间 长 很 多 ,那么 布 斯 算法 可 以 大 大 提高 性 能 。 这 当然 一 定 程度 上 取决 于 乘 数 。 如 果 乘 数 有 0 
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或 1 的 数字 串 ， 则 算法 会 实现 得 很 好 。 如 果 乘 数 由 0 或 1 交替 的 数字 串 组 成 (最 坏 的 情况 ) ， 则 
使 用 布 斯 算法 可 能 比 标准 方法 需要 更 多 的 操作 。 

计算 机 通过 加 法 和 移 位 存储 在 寄存 器 中 的 值 来 执行 布 斯 算法 。 这 时 需要 一 个 名 为 算术 移 位 
的 特殊 类 型 的 移 位 来 保留 符号 位 。 许 多 书 只 是 对 寄存 器 的 算术 移 位 和 加 法 操作 阐述 了 布 斯 算 
法 ， 并 且 看 起 来 与 前 面 的 方法 完全 不 同 。 我 们 介绍 的 布 斯 算法 更 类 似 于 大 家 都 熟悉 的 铅笔 和 纸 
的 方法 ， 但 它 等 同 于 别处 介绍 的 计算 机 算法 。 

| 已 经 有 许多 为 快速 乘法 开发 的 算法 ， 但 是 很 多 都 不 适用 于 有 符号 乘法 。 布 斯 算法 不 仅 允许 
在 大 多 数 情况 下 能 更 快 地 执行 乘法 ， 而 且 它 还 能 在 应 用 于 有 符号 数 时 带 来 更 多 的 好 处 。 


2.4.6 进位 和 溢出 


前 面 所 提 到 的 “返回 零 ” 的 情况 都 是 真正 的 溢出 。CPU 通常 具有 指示 进位 和 溢出 的 标志 。 
但 是 ， 溢 出 标志 仅 用 于 有 符号 数 ， 在 无 符号 数 中 没有 意义 ， 在 无 符号 数 中 使 用 进位 标志 。 如 果 
进位 (表示 最 左边 的 位 有 进位 ) 出 现在 无 符号 数 中 ,我 们 知道 有 溢出 (新 值 太 大 而 无 法 存储 在 给 
定 的 位 数 中 ) 了 ， 但 溢出 位 并 没有 置 位 。 进 位 同样 会 发 生 在 有 符号 数 中 ， 然 而 ， 在 有 符号 数 中 
出 现 的 这 种 情况 ， 对 于 溢出 而 言 既 不 充分 也 不 必要 。 我 们 已 经 看 到 ， 如 果 在 有 符号 数 中 进入 最 
左边 位 的 进位 和 最 左边 位 出 来 的 进位 不 同 ， 则 可 以 确定 有 溢出 。 然 而 ， 在 无 符号 运算 中 ， 从 最 
左边 位 出 来 的 进位 总 是 指示 溢出 。 

为 了 说 明 这 些 概念 ， 考 虑 4 位 无 符号 数 和 有 符号 数 。 如 果 将 两 个 无 符号 数 0111(7) 和 0001 
(1) 相 加 ， 得 到 1000(8)。 由 于 没有 进位 ， 因 此 没有 错误 。 然 而 ， 如 果 将 两 个 无 符号 数 0111 
(7) 和 1011(11) 相 加 ,会 得 到 0010 并 产生 进位 。 这 表示 出 现 了 错误 (实际 上 ,，7 + 11 不 等 于 
2) 。 这 将 会 导致 CPU 设置 进位 标志 。 实 际 上 ， 即 使 溢出 标志 未 设置 ， 无 符号 数 中 的 进位 意味 

我 们 说 在 无 符号 数 中 符号 位 进位 对 于 溢出 既 不 充分 也 不 必要 。 考 虑 用 2 的 补 码 表示 的 整数 
0101( +5) 和 0011( +3) 相 加 。 结 果 是 1000( -8) ， 这 明显 不 正确 。 问 题 是 有 一 个 进位 进入 符 
号 位 ， 但 没有 进位 出 符号 位 ， 这 表明 有 一 个 溢出 (因此 ， 进 位 对 溢出 不 是 必需 的 ) 。 但 是 ， 如 
果 现 在 对 0111( +7) 和 1011( -5) 做 加 法 运算 ， 我 们 得 到 正确 的 结果 : 0010( +2)。 最 左边 的 
位 既 有 进位 进入 也 有 进位 出 来 ， 所 以 没有 错误 (进位 对 溢出 不 是 必需 的 ) 。 进 位 标志 将 置 位 ， 
但 溢出 标志 将 不 会 置 位 。 因 此 ， 在 有 符号 数 中 ， 有 符号 位 进位 并 不 一 定 表示 有 错误 ， 同 样 没有 
符号 位 进位 并 不 一 定 表示 答案 是 正确 的 。 

总 而 言 之 ， 用 于 确定 进位 何 时 表示 错误 的 经 验 法 则 取决 于 是 使 用 的 是 有 符号 数 还 是 无 符号 
数 。 对 于 无 符号 数 ， 一 个 进位 (最 左边 位 出 来 的 ) 表示 位 的 总 数 不 够 大 不 足以 保存 结果 值 ， 并 
发 生 溢出 。 对 于 有 符号 数 ， 如 果 进 入 符号 位 的 进位 和 从 符号 位 出 来 的 进位 不 同 ， 则 发 生 溢出 。 
溢出 标志 仅 在 有 符号 数 溢出 时 置 位 。 

进位 和 溢出 显然 彼此 独立 地 发 生 。 在 表 2-2 中 给 出 使 用 以 有 符号 数 2 的 补 码 表示 的 例子 。 
表 中 没有 表示 进位 到 符号 位 的 情况 。 











0100( +4) +0010( +2) 
0100( +4) +0110( +6) 
1100( -4) +1110( -2) 
1100( -4) +1010( -6) 


0110( +6) 
1010( -6) | NO 
1010( -6) 
0110( +6) 








NO 
Yes 























2. 4.7 使 用 移 位 进行 二 进 制 乘法 和 除法 

移 位 一 个 二 进 制 数 意味 着 左 移 或 右 移 一 定 的 位 数 。 例 如 ， 二 进 制 数值 00001111 向 左 移 一 
位 得 到 的 结果 是 00011110( 如 果 我 们 在 右边 填 上 一 个 零 ) 。 第 一 个 数 是 十 进 制 值 5 ， 第 二 个 是 
十 进 制 30， 这 恰好 是 第 一 个 数 的 两 倍 。 这 不 是 巧合 ! 

当 使 用 有 符号 数 的 2 的 补 码 时 ， 可 以 使 用 一 个 名 为 算术 移 位 的 特殊 类 型 的 移 位 ， 以 快速 且 
容易 地 执行 乘 以 2 和 除 以 2 的 操作 。 回 想 在 2 的 补 码 中 ， 最 左边 的 位 决定 它 的 符号 ， 所 以 必须 
小 心 移动 这 些 值 ， 我 们 不 能 改变 符号 位 ， 当 乘 以 2 或 除 以 2 时 不 应 该 改变 该 数 的 符号 。 

我 们 可 以 执行 算术 左 移 (将 数字 乘 以 2 ) 或 算术 右 移 (将 数字 除 以 2) 。 假 设 位 的 编号 是 从 右 
到 左 并 从 0 开始 编号 ， 有 以 下 对 算术 左右 移 位 的 定义 。 

算术 左 移 插入 一 个 0 到 乌 位 ， 并 将 所 有 其 他 位 向 左 移 一 个 位 置 ， 使 得 六 ,位 被 凡 ;位 替代 。 
1, 位 是 符号 位 ， 如 果 该 位 的 值 发 生 改 变 ， 则 会 引起 操作 溢出 。 在 二 进 制 数 中 ， 乘 以 2 总 是 使 
得 最 右 一 位 等 于 0， 这 是 一 个 偶数 ， 因 此 解释 了 为 什么 用 一 个 零 填充 最 右边 。 思 考 以 下 示例 : 

计算 11( 使 用 8 位 有 符号 数 的 2 的 补 码 表示 ) 乘 以 2 的 结果 。 

我 们 从 计算 11 的 二 进 制 值 开 始 : 


00001011 
左 移 一 位 ， 结 果 是 : 
00010110 
这 是 十 进 制 22 =11 x2。 没 有 溢出 发 生 ， 所 以 这 个 值 正确 。 4 


计算 12( 使 用 8 位 有 符号 数 的 2 的 补 码 表示 ) 乘 以 4 的 结果 。 
我 们 从 计算 12 的 二 进 制 值 开始 : 
O00001100 
左 移 两 位 (每 次 移 位 相当 于 乘 以 2， 所 以 两 次 移 位 等 于 乘 以 4) ， 结 果 是 : 
OO000 
这 是 十 进 制 的 48 =12 x4。 没 有 溢出 发 生 ， 所 以 这 个 值 正确 。 < 
计算 66( 使 用 8 位 有 符号 数 的 2 的 补 码 表示 ) 乘 以 2 的 结果 。 
我 们 从 计算 66 的 二 进 制 值 开始 : 


01000010 
左 移 一 位 ， 结 果 是 : 
10000100 
但 是 符号 位 已 经 改变 了 ， 所 以 发 生 了 溢出 (66 x2 = 132， 这 个 数 太 大 ， 不 能 使 用 8 位 有 符 
号 数 的 2 的 补 码 表 示 ) 。 | 


算术 右 移 是 将 所 有 位 向 右 移动 ， 但 复制 符号 位 从 5, ,位 到 b, ,位 。 因 为 我 们 从 右 到 左 复制 
符号 位 ， 所 以 溢出 不 是 一 个 问题 。 然 而 ， 除 以 2 可 能 有 一 个 余数 1; 使 用 这 种 方法 的 除法 运算 
是 严格 的 整数 除法 ， 所 以 在 任何 情况 下 余数 都 不 能 被 存储 。 思 考 以 下 示例 : 
(全权 S9 计算 12( 使 用 8 位 有 符号 数 的 2 的 补 码 表示 ) 除 以 2 的 结果 。 
我 们 从 计算 12 的 二 进 制 值 开 始 : 
00001100 
右 移 一 位 ， 复 制 符号 位 0， 结果 是 : 
OOO000L10 
这 是 十 进 制 的 6 =12 =2。 要 
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人 本 计算 12( 使 用 8 位 有 符号 数 的 2 的 补 码 表示 ) 除 以 4 的 结 
我 们 从 计算 12 的 二 进 制 值 开始 : 
O0001100 
右 移 两 位 ， 结 果 是 : 
00000011 
这 是 十 进 制 的 3 =12 =4。 < 
CEB 计算 -14( 使 用 8 位 有 符号 数 的 2 的 补 码 表示 ) 除 以 2 的 结果 。 
我 们 从 计算 - 14 的 2 的 补 码 表 示 开 始 : 
LiL QE 
右 移 一 位 ( 带 符号 位 ) ， 结 果 是 : 
Lh 0 
这 是 十 进 制 的 -7= -14=2。 a 
注意 ， 如 果 我 们 将 - 15 除 以 2( 见 例 2.33)， 结果 是 将 是 11110001 向 左 移动 一 位 得 到 
11111000， 这 是 -8。 因 为 我 们 做 的 是 整数 除法 ， 所 以 -15 除 以 2 确实 等 于 -8。 


2.5 浮 点 数 表示 

如 果 想 要 搭建 一 台 真正 的 计算 机 ， 可 以 使 用 刚刚 研究 过 的 任何 整数 表示 法 。 我 们 将 选择 其 
中 一 个 并 继续 设计 任务 。 下 一 步 是 决定 系统 的 字 大 小 。 如 果 和 希望 系统 很 便宜 ， 那 么 应 选择 一 个 
较 小 的 字 大 小 ， 比 如 说 16 位。 车 有 符号 位 ， 该 系统 可 以 存储 的 最 大 整数 是 32 767。 所 以 现在 
我 们 应 该 做 一 些 事情 来 适应 潜在 的 客户 ， 他 们 想 保存 某 一 年 内 观看 职业 体育 赛事 的 观众 统计 人 
数 。 当 然 ， 这 个 数字 大 于 32 767。 没 问题 ! 让 我 们 把 字 大 小 变 得 更 大 些 。32 位 应 该 够 了 。 我 们 
的 字 现在 对 于 任何 想 要 计数 的 任何 事情 都 足够 大 了 。 但 如 果 这 个 客户 还 需要 知道 每 位 观众 每 分 
钟 实际 观看 比赛 花费 的 钱 数 。 此 数字 可 能 是 一 个 十 进 制 小 数 。 现 在 我 们 真 的 被 卡 住 了 。 

解决 这 个 问题 最 简单 和 最 便宜 的 方法 是 继续 使 用 16 位 系统 ， 并 说 :“ 嘿 ,我 们 正在 建立 一 
个 廉价 的 系统 。 如 果 你 想 用 它 做 些 奇特 的 事情 ， 那 么 你 自己 会 变 成 一 个 好 的 程序 员 。” 虽 然 在 
今天 的 技术 中 这 听 起 来 非常 滑稽 ， 但 在 每 一 代 计算 机 的 早期 ， 这 是 一 个 实际 情况 。 在 许多 第 一 
代 大 型 机 或 微型 计算 机 中 根本 没有 像 浮 点 单元 这 样 的 东西 。 多 年 来 ， 聪 明 的 编程 技术 使 这 些 整 
数 系统 能 够 像 浮 点 系统 一 样 运行 。 

如 果 你 熟悉 科学 计数 法 ,那么 你 可 能 已 经 在 考虑 如 何 处 理 浮 点 数 的 操作 了 ， 即 如 何在 一 个 
整数 系统 中 模拟 浮 点 数 运算 。 在 科学 计数 法 中 ， 数 字 可 以 表示 为 两 部 分 : 小 数 部 分 和 指数 部 
分 ， 指 数 部 分 表示 将 小 数 部 分 扩大 10 的 若干 次 宕 以 得 到 所 需要 的 值 。 所 以 要 以 科学 计数 法 表 
示 32 767， 可 以 写 为 3. 2767 x 10*。 科 学 计数 法 简化 了 非常 大 或 非常 小 的 数字 使 用 铅笔 和 纸 的 
计算 过 程 。 它 也 是 当今 数字 计算 机 中 浮 点 计算 的 基础 。 


2.5.1 一 个 简单 的 模型 


在 数字 计算 机 中 ， 浮 点 数 由 3 部 分 组 成 : 符号 位 、 指 数 部 分 (表示 2 的 寡 指 数 ) 和 小 数 部 分 
(这 引发 了 大 量 关 于 采用 哪 种 术语 合适 的 争论 ) 。 当 指 代 小 数 部 分 时 ， 术 语 尾数 被 广泛 接受 。 
然而 ， 许 多 人 对 采用 这 个 术语 持 反对 意见 ， 因 为 尾数 也 表示 对 数 的 小 数 部 分 ， 但 它 与 浮 点 数 的 
小 数 部 分 不 同 。IEEE 引入 术语 有 效 数 并 结合 隐 含 的 二 进 制 小 数 点 和 隐 含 的 1( 我 们 在 本 节 结 
处 讨论 ) 来 指 代 浮 点 数 的 小 数 部 分 。 遗 憾 的 是 , “尾数 ”和 “有 效 数 ”这 两 个 术语 在 指 代 浮 点 
数 的 小 数 部 分 时 已 经 可 以 互 换 了 ， 然 而 它们 在 技术 上 并 不 等 同 。 在 本 文中 ， 我 们 将 小 数 部 分 称 
为 有 效 数 ， 而 不 管 其 是 否 包含 [EEE 提 到 的 隐 含 的 1。 
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用 于 表示 指数 和 有 效 数 的 二 进 制 位 数 取决 于 我 们 是 希望 优化 范围 (在 指数 中 有 更 多 位 ) 还 
是 优化 精度 (在 有 效 数 中 有 更 多 位 ) 。( 我 们 在 2. 5. 7 节 会 更 详细 地 讨论 范围 和 精度 。) 对 于 本 节 
的 剩余 部 分 ， 我 们 将 使 用 一 个 14 位 模型 ， 它 包括 5 位 指数 、8 位 有 效 数 和 1 个 符号 位 ( 见 


图 2-1) 。 更 一 般 的 形式 在 2. 5. 2 节 中 描述 。 页 
假设 希望 在 模型 中 存储 十 进 制 数 17。 我 们 知 We 


道 17=17.0 x10" = 二 7Xx10 =0.17Xx10”。 类 似 
地 ， 在 二 进 制 中 ，17,。= 10001, x2"” = 1000. 1, x2' 
=100. 01, x2? =10. 001, x2” =1.0001, x2”=0. 10001, x25。 如 果 使 用 最 后 一 个 形式 ， 则 小 数 部 
分 为 10001000， 指 数 为 00101， 如 下 所 示 : 


图 2-1 浮 点 表示 的 简单 模型 





| 天 








使 用 这 种 形式 ， 可 以 存储 比 14 位 ( 它 一 共 使 用 14 个 二 进 制 数字 加 上 一 个 二 进 制 小 数 点 ) 定 
点 表示 更 大 的 数 。 如 果 想 在 这 个 模型 中 表示 65 536 = 0. 1, x2”， 则 它 表示 为 : 


[0 Tre 


这 个 模型 的 一 个 明显 问题 是 没有 提供 负 的 指数 。 这 样 就 没有 办 法 存储 0.25， 因 为 0.25 是 
0.01 =1, x2”*， 指 数 -2 不 能 被 表示 。 我 们 可 以 通过 向 指数 添加 一 个 符号 位 解决 这 个 问题 ， 
但 事实 证 明 使 用 移 码 指 数 更 有 效 ， 因 为 当 比 较 两 个 浮 点 数 时 ,我们 可 以 使 用 专门 为 无 符号 数 设 
计 的 更 简单 的 整数 电路 。 

回想 一 下 2. 4.3 节 ， 偏 移 值 的 想法 是 将 该 范围 中 的 每 个 整数 转换 为 非 负 整数 ， 然 后 存储 为 
二 进 制 数 。 首 先 将 这 个 固定 偏 移 值 加 到 每 个 指数 上 ， 然 后 调整 指数 范围 内 的 整数 。 这 个 偏 移 值 
是 靠近 可 能 值 范 围 中 间 的 一 个 值 ， 是 我 们 选择 表示 0 的 值 。 在 这 种 情况 下 ， 我 们 将 选择 15， 因 
为 它 在 0 和 31 中 间 ( 指 数 有 5 位 ， 因 此 人 允许 表示 2 或 数值 32 ) 。 指 数字 段 中 任何 大 于 15 的 数字 
表示 正 值 ， 小 于 15 的 值 表示 负 值 。 这 称 为 偏 移 值 为 15 的 移 码 表示 方法 ， 因 为 我 们 必须 减 去 15 
以 获得 指数 的 真实 值 。 注 意 ， 全 0 或 全 1 的 指数 通常 被 保留 以 用 于 特殊 数 ( 如 零 或 无 穷 大 ) 。 在 
我 们 的 简单 模型 中 ， 人 允许 有 全 0 和 全 1 的 指数 。 

回 到 要 存储 17 的 示例 中 ， 我们 计算 得 到 17,, =0. 10001, x25 。 偏 差 指数 现在 为 15 +5 =20: 











[ol Sw i 0 | Do 000| 





如 果 我 们 想 存 储 0.25 =0.1x2”， 则 有 : 
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这 个 系统 还 有 一 个 相当 大 的 问题 : 每 个 数字 都 没有 唯一 的 表示 。 以 下 所 有 的 内 容 都 是 等 效 的 : 


| 。 Ld 




















0 TO i Oi 0 0 vr 0 oe 
0 | 计 六 和 
人 | 








因为 这 些 同 义 形式 不 太 适 合 数字 计算 机 ， 所 以 浮 点 数 必须 被 规范 ， 也 就 是 说 ， 有 效 数 的 最 


计算 机 系统 由 的 数据 表示 了 2 





左边 的 位 必须 总 是 1。 这 个 过 程 称 为 规格 化 。 这 个 约定 的 另外 一 个 优点 是 ， 如 果 隐 含 了 1, 那 
么 在 有 效 数 中 , 我 们 获得 了 额外 的 一 位 精度 。 规 格 化 对 于 除 0 之 外 的 不 包含 非 零 位 的 每 个 值 都 
能 正常 工作 。 因 此 ， 表 示 浮 点 数 的 任何 模型 都 必须 将 零 视 为 特殊 情况 。 我 们 将 在 下 一 节 中 看 到 
IEEE-754 浮 点 标准 对 规范 化 规则 例外 的 说 明 。 

全 要 本 )》 使 用 偏 移 值 为 15 的 移 码 表示 的 简单 模型 把 0. 031 25, 表 示 为 规格 化 浮 点 形式 。 

001 广 天 二 000 2 =0.001x2 =0.01x2™ S01%2” 

应 用 这 个 移 码 ， 指 数 域 是 15 -4 = 11。 


[el 0 | 1 人 | 








请 注意 ， 在 简单 模型 中 ， 没 有 使 用 隐 含 1 的 标准 化 方法 来 表示 这 个 数 ， 这 在 2. 5.4 节 中 
介绍 。 者 
2.5.2 浮 点 运算 
” ”如果 我 们 想 对 用 科学 计数 法 表示 的 两 个 十 进 制 数字 进行 相 加 ， 如 1.5 x10: +3.5 x10’, 我 
们 改变 其 中 一 个 数字 ， 使 它们 都 以 相同 的 指数 来 表示 。 在 这 个 例子 中 ,1.5 x10? +3.5 x103 = 
0. 15 x10” +3.5 x10 =3.65 x10’。 浮 点 加 法 和 减法 的 工作 方式 相同 ， 如 下 所 示 。 

全 醒 对 使 用 规范 的 14 位 格式 和 移 码 为 15 的 简单 模型 所 表示 的 以 下 二 进 制 数 做 加 法 


运算 。 
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我 们 看 到 加 数 扩 大 了 二 次 方 ， 而 被 加 数 扩 大 了 零 次 方 。 在 二 进 制 小 数 点 上 对 齐 了 这 两 个 操 
作 数 ， 得 出 : 
11. 001 000 
+0. 100 110 10 
11. 101 110 10 


重新 规格 化 ， 保 留 较 大 的 指数 并 截断 低位 。 因 此 有 : 


[oo | re 











然而 ， 因 为 我 们 的 简单 模型 需要 一 个 规范 化 的 有 效 数 ， 所 以 没有 办 法 表示 零 。 这 可 以 通过 
允许 全 0 数字 串 ( 零 符号 、 零 指数 和 零 有 效 数 ) 表 示 数 值 堆 来 补救 。 在 下 一 节 中 ， 
IEEE-754 对 于 某 些 位 模式 也 保留 了 特殊 的 含义 。 

乘法 和 除法 运算 使 用 与 十 进 制 运 算 相同 的 指数 规则 ， 例 如 , 27 x2 =2'。 


作假 设 有 一 个 15 位 的 移 码 ， 做 乘法 : 





0 10010 |110010 0 0 |=0.100000x2 














,| 10000 [100110 1 0 |=0.10000x2 





0. 110 010 00 乘 以 0. 100 110 10 得 到 的 乘积 为 0. 011 110 000 101 0000， 然 后 2” x2 =2 得 到 
111. 100 001 01。 重 新 规格 化 和 使 用 适当 的 指数 ， 浮 点 数 的 积 是 : 
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2. 5.3 浮 点 误差 


当 使 用 铅笔 和 纸 来 解决 三 角 问 题 或 计算 投资 的 利息 时 ,我 们 知道 这 是 在 实数 系统 中 进行 的 
计算 。 我 们 还 知道 这 个 系统 是 无 限 的 ， 因 为 对 于 任何 一 对 实数 ， 总 是 可 以 找到 一 个 更 小 的 实数 
和 男 一 个 更 大 的 实数 。 

与 我 们 想象 中 的 数学 不 同 ， 计 算 机 是 带 有 有 限 存储 空间 的 有 限 系 统 。 当 我 们 让 计算 机 执行 浮 
点 运算 时 ， 我 们 是 在 有 限 的 整数 系统 中 对 实数 的 无 限 系 统 建 模 。 事 实 上 ， 我 们 所 得 到 的 是 实数 系 
统 的 近似 值 。 使 用 的 位 越 多 ， 这 个 近似 值 越 精确 。 但 是 ， 无 论 使 用 多 少 位 ， 总 会 有 一 些 误差 。 

浮 点 误差 可 能 是 明显 的 、 微 小 的 或 不 易 察 觉 的 。 明 显 的 误差 (如 数字 上 溢 或 下 溢 ) 会 导致 
程序 崩溃 。 微 小 的 误差 可 能 导致 失去 控制 的 错误 结果 ， 但 这 种 误差 在 导致 真正 的 问题 之 前 往往 
很 难 检测 出 。 例 如 ， 在 我 们 的 简单 模型 中 ， 可 以 在 -.11111111, x2" 到 +.11111111, x2 范围 
内 表示 规格 化 数字 。 显 然 ， 我 们 不 能 存储 2 “或 2”， 因 为 它们 明显 不 适合 。 我 们 不 能 准确 地 
存储 128.5， 这 确实 不 是 很 明显 ， 因 为 这 个 数 在 规定 的 范围 内 。 将 128.5 转换 为 二 进 制 数 
10000000.1， 它 是 9 位 宽 。 我 们 的 有 效 数 只 能 保存 8 位 。 通 常 ， 低 阶 位 被 丢弃 或 舍 入 到 下 一 
位 。 然 而 ， 无 论 我 们 如 何 处 理 它 ， 都 在 系统 中 引入 了 一 个 误差 。 

可 以 用 误差 的 绝对 值 与 数 的 真实 值 之 比 计 算 表 示 中 的 相对 误差 。 使 用 128. 5 的 例子 ， 我 们 
发 现 : 

128. 5 =128 
128: 5 


如 果 我 们 不 小 心 ， 这 样 的 误差 可 以 通过 漫长 的 计算 过 程 进行 传播 ， 从 而 导致 严重 的 精度 损 
失 。 表 2-3 说 明了 当 使 用 14 位 简单 模型 执行 16. 24 迭代 地 乘 以 0. 91 时 误差 的 传播 情况 。 把 这 
些 数 转 换 到 8 位 二 进 制 ， 我们 看 到 从 一 开始 就 有 严重 的 误差 。 

正如 你 所 看 到 的 ， 在 6 次 迭代 中 ， 乘积 中 的 误差 增加 了 两 倍 多 。 连 续 迭 代 将 产生 100% 的 
误差 ， 因 为 乘积 最 终 会 变 为 零 。 虽 然 这 个 14 位 模型 很 小 ， 以 至 于 夸大 了 误差 , 但 所 有 浮 点 系 
统 的 运算 方式 都 是 一 样 的 。 不 管 这 个 系统 有 多 大 ， 在 有 限 系统 中 表示 实数 时 总 会 有 一 定 程 度 的 
误差 。 即 使 最 小 的 误差 也 可 能 产生 灾难 性 的 结果 ， 特 别 是 当 计 算 机 用 于 控制 物理 事件 时 ， 例 如 
在 军事 和 医疗 应 用 中 。 对 计算 机 科学 家 的 挑战 是 在 性 能 和 经 济 允 许 的 范围 内 找到 用 于 控制 此 类 
误差 的 有 效 算法 。 


=0. 003 891 05 =0. 39% 


表 2-3 在 一 个 14 位 浮 点 数 中 误差 的 传播 


乘 数 被 乘 数 14 位 乘积 实际 的 乘积 ”误差 
10000. 001 x 0.11101000 = 1110. 1001 14. 7784 1.46% 
(16. 125) (0. 90625 ) (14. 5625 ) 】 
1110, 1001 x 0.11101000 = 1101. 0011 13. 4483 1.94% 
(14. 5625) (13. 1885) \ 
1101. 0011 ”T1101000 .= 1011. 1111 12. 2380 2.46% 
Ch3: 1885) (11.9375) 

1011. 1111 x 0.11101000 = 1010. 1101 11. 1366 2.91% 
(11.9375) (10. 8125) 

1010. 1101 x 0.11101000 = 1001. 1100 10. 1343 3.79% 
(10. 8125) CO TD 

1001. 1100 x 0.11101000 = 1000. 1101 8. 3922 4.44% 


(9.75) (8. 8125) 
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2.5.4 1IEEE-754 浮 点 标准 


我 们 在 本 节 中 使 用 的 浮 点 模型 是 为 了 简化 和 理解 概念 而 设计 的 。 可 以 扩展 这 个 模型 为 任何 
我 们 想 要 的 位 数 。 直 到 20 世纪 80 年 代 ， 这 种 扩展 都 是 纯粹 的 任意 的 ， 导 致 在 各 个 制造 商 的 系 
统 中 有 许多 不 兼容 的 表示 。 在 1985 年 ，IEEE 公布 了 单 精 度 和 双 精 度 浮 点 数 标 准 。 该 标准 官方 
称 为 IEEE-754(1985) 。IEEE-754 标准 不 仅 定义 了 二 进 制 浮 点 表示 ， 而 且 指定 了 基本 操作 、 昼 
常 条 件 、 转 换 和 算术 。 另 一 个 标准 是 IEEE 854 一 1987， 它 提供 了 类 似 的 十 进 制 算术 规范 。2008 
年 ， 人 EEE 修订 了 754 标准 ， 并 成 为 人 们 所 熟知 的 IEEE 754 一 2008。 它 沿 习 了 754 的 单 精度 和 双 
精度 ， 并 增加 了 对 十 进 制 算术 和 格式 的 支持 ， 取 代 了 754 和 854。 我 们 只 讨论 浮 点 数 的 单 精度 
和 双 精 度 表 示 。 

IEEE-754 单 精度 标准 在 8 位 指数 上 使 用 偏 移 值 为 127 的 移 码 。 有 效 数 假定 在 小 数 点 左边 隐 
含 一 个 1， 总 共 是 23 位。 隐 含 的 1 被 称 为 隐藏 位 或 隐藏 1， 并 人 允许 实际 有 效 数 为 24(24 =23 + 
1) 位 。 包 括 符号 位 在 内 ， 总 数字 长 为 32 
位 ， 如 图 2-2 所 示 。 





我 们 前 面 提 到 IEEE-754 规格 化 规则 黎阳 于 we 


有 一 个 例外 。 因 为 这 个 标准 假定 在 小 数 点 
的 左边 有 1 个 隐 含 的 1， 有 效 数 中 的 首位 


图 2-2 IEEE-754 单 精 度 浮 点 表示 


确实 可 以 为 零 。 例 如 ， 数 字 5.5 =101. 1, = . 1011, x2 。IEEE-754 假定 在 小 数 点 左 侧 有 1 个 隐 
含 的 1， 因 此 表示 5.5 为 1.011, x2*。 因 为 1 是 隐 含 的 ， 有 效 数 为 011， 不 是 以 1 开头 的 。 

表 2-4 显示 了 几 个 单 精 度 浮 点 数 表 示 ， 包 括 一 些 特 殊 的 数 。 应 该 注意 ，0 不 是 直接 用 给 定 
格式 表示 的 ， 因 为 在 有 效 数 中 要 求 一 位 隐藏 位 。 因 此 ，0 是 使 用 指数 全 为 0 以 及 有 效 数 全 为 0 
表示 的 特殊 值 。IEEE-754 允许 -0 和 +0， 尽管 它 们 是 相等 的 值 。 因 此 ， 当 比较 浮 点 数 为 0 时 ， 
程序 员 应 该 着 慎 。 


表 2-4 IEEE-754 单 精度 浮 点 数 的 一 些 例子 









































1.0 | 0 01111111 00000000000000000000000 
0.5 0 01111110 00000000000000000000000 
19.5 0 10000011 00111000000000000000000 
-3.75 1 10000000 11100000000000000000000 
0 0 00000000 00000000000000000000000 
无 穷 0/1 11111111 00000000000000000000000 
不 是 数值 的 特殊 值 0/1 11111111 任意 非 零 有 效 数 

非 规格 化 数 0/1 00000000 ”任意 非 零 有 效 数 


当 指 数 为 255 时 ， 表 示 的 值 为 无 穷 大 (其 有 一 个 零 有 效 数 ) 或 “ 非 数 ”( 其 具有 一 个 非 零 有 
效 数 ) 。“ 非 数 ” 或 NaN 用 于 表示 不 是 实数 的 值 ( 例 如 ， 负 数 的 平方 根 ) 或 者 作为 错误 指示 符 
(如 “ 除 零 ” 错 误 ) 。 

根据 正 EE-754 标准 ， 大 多 数 数值 被 规格 化 并 使 其 有 效 数 有 一 个 隐 式 前 导 1( 假 定 在 小 数 点 
左边 ) 。 另 一 个 重要 的 约定 是 当 指数 是 零 时 ， 有 效 数 不 为 零 。 这 表示 一 个 没有 隐藏 位 的 非 规格 
化 数字 。 

单 精度 浮 点 数 可 表示 的 最 大 值 (暂时 不 考虑 符号 ) 是 2”x1.11111111111111111111111， 
( 称 为 MAX 值 ) 。 我 们 不 能 使 用 全 1 的 指数 ， 因 为 那 是 为 NaN( 不 是 数值 的 特殊 值 ) 保留 的 。 








我 们 可 以 表示 的 最 小 数字 为 2” x.00000000000000000000001,( 称 为 MIN ) 。 我 们 可 以 使 用 
全 0 的 指数 (这 意味 着 数字 是 非 规范 的 ) ， 因 为 有 效 数 是 非 零 值 ( 并 且 表 示 为 2 ) 。 由 于 前 
面 的 特殊 值 和 有 限 的 位 数 ， 单 精度 浮 点 数 不 能 表示 4 个 数字 范围 : 小 于 - MAX 的 负数 ( 负 洲 
出 ) ， 大 于 -MIN 的 负数 ( 负 下 溢 ) ， 小 于 +MIN 的 正 数 ( 正 下 溢 ) ， 和 大 于 +MAX 的 正 数 ( 正 
溢出 )。 

双 精 度数 字 是 使 用 由 11 位 指数 和 52 位 有 效 数 组 成 的 64 位 有 符号 数 。 移 码 是 1023。 数 值 
范围 可 以 表示 为 图 2-3 所 示 的 正 EE 双 精 度 模型 。 当 指数 为 2047 时 隐 含 为 NaN。 零 和 无 穷 大 的 


表示 对 应 于 单 精度 模型 。 
0 


一 1.0 x10308 一 1.0 x10-308 1:0.x103% 1.0 x10308 
图 2-3 IEEE-754 双 精 度数 的 范围 


由 于 在 性 能 上 会 有 一 些 代价 ， 大 多 数 浮 点 处 理 单元 (FPU) 只 使 用 64 位 模型 ， 因 此 只 需要 
设计 和 实现 一 组 专用 电路 。 

几乎 每 个 最 近 设 计 的 计算 机 系统 都 采用 了 IEEE-754 浮 点 模型 。 不 幸 的 是 ， 在 这 个 标准 颁 
布 之 前 ， 很 多 大 型 计算 机 系统 已 经 建立 了 自己 的 浮 点 系统 。 把 久 负 盛 誉 的 架构 转变 到 较 新 的 系 
统 已 经 花费 了 几 十 年 的 时 间 ， 如 IBM 大 型 机 现在 支持 自己 的 传统 浮 点 系统 和 IEE-754。 然 而 ， 
在 1998 年 之 前 ，IBM 系统 一 直 在 使 用 源 于 1964 年 System/360 使 用 的 相同 的 浮 点 运算 架构 。 预 
计 这 两 个 系统 将 继续 得 到 支持 ， 因 为 在 这 些 系统 上 运行 着 大 量 旧 的 软件 。 


2. 5.5 表 数 范围 、 精 度 和 准确 度 

当 讨 论 浮 点 数 时 ， 重 要 的 是 理解 这 些 术 语 : 表 数 范围 、 精 度 和 准确 度 。 范 围 非常 简单 ， 因 
为 它 表 示 在 给 定格 式 中 从 最 小 值 到 相同 格式 最 大 值 的 间隔 。 例 如 ，16 位 2 的 补 码 的 整数 范围 是 
-32768 ~ +32767。IEEE-754 双 精 度 浮 点 数 的 范围 在 图 2-3 中 已 给 出 。 即 使 有 这 么 大 的 范围 ， 
我 们 知道 仍 有 无 穷 多 个 数 并 不 在 正 EE-754 规定 的 范围 内 。 浮 点 数 完全 可 以 工作 的 原因 是 ,在 
这 个 范围 内 总 会 有 一 个 数 接 近 你 想 要 的 数 。 

人 们 对 范围 理解 的 没有 问题 ,但 对 精度 和 准确 度 经 常会 混淆 。 准 确 度 是 指数 字 接 近 其 真实 
值 的 程度 。 例 如 ， 我 们 不 能 用 浮 点 表示 0. 1， 但 我 们 可 以 在 这 个 范围 内 找到 一 个 相对 接近 0. 1 
的 数 或 相当 准确 的 数 。 另 一 方面 ， 精 度 涉及 对 一 个 值 我 们 有 多 少 信息 和 有 多 少 信息 量 用 于 表示 
该 值 。1. 666 是 一 个 有 4 位 精度 的 十 进 制 数字 ; 1. 6660 是 有 5 位 精度 的 十 进 制 数 字 ， 它 们 同样 
都 是 准确 的 数 。 第 二 个 数 并 不 比 第 一 个 数 准 确 度 高 。 

准确 度 必须 放 在 上 下 文中 一 一 想 知 道 一 个 值 多 么 准确 ， 我 们 必须 知道 它 是 多 接近 它 的 预期 
值 或 “ 真 值 ”。 当 我 们 看 两 个 数字 时 ， 不 能 仅仅 因为 第 一 个 数 的 精度 位 数 更 多 ， 就 立即 说 第 一 
个 比 第 二 个 更 准确 。 

虽然 它们 是 分 开 的 ， 但 精度 和 准确 度 却 是 相关 的 。 更 高 的 精度 通常 使 值 更 准确 ， 但 并 不 总 
是 这 样 。 例 如 ， 我 们 可 以 将 值 1 表示 为 整数 、 单 精度 浮 点 数 或 双 精 度 浮 点 数 ， 但 每 种 都 是 同样 
(精确 ) 准确 的 。 另 一 个 示例 ,考虑 3. 133 33 作为 站 的 估计 值 。 它 有 6 位 数 的 精度 ， 但 准确 度 
只 有 两 位 数 。 增 加 更 多 的 精度 并 不 能 提高 准确 度 。 

另 一 方面 ， 当 0.4 x0.3 时 ， 准 确 度 取决 于 精度 。 如 果 只 人 允许 有 一 个 小 数位 的 精度 ， 那 么 
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结果 是 0. 1( 它 接近 但 不 完全 是 结果 )。 如 果 人 允许 有 两 个 小 数位 的 精度 ， 则 得 到 0. 12， 这 就 准确 
地 反映 了 答案 。 


2. 5.6 有 关 浮 点 数 的 其 他 问题 

我 们 已 经 看 到 浮 点 数 可 以 发 生 上 溢 和 下 洲 。 此 外 ,我 们 知道 浮 点 数 可 能 不 能 准确 地 代表 我 
们 希望 的 值 ， 就 像 对 于 十 进 制 数 0.1 的 二 进 制 浮 点 表示 发 生 的 舍 人 误差 一 样 。 正 如 我 们 所 看 到 
的 ， 这些 舍 入 错误 可 以 传播 ， 并 导致 实质 性 问题 。 

哩 然 舍 人 是 不 可 取 的 ,但 这 是 可 以 理解 的 。 除 了 舍 入 问题 以 外 ， 浮 点 Ca 
于 实数 运算 ， 这 两 个 方面 相当 令 人 不 安 并 且 不 一 定 是 直观 的 。 第 一 ， 浮 点 运算 不 总 是 满足 结 
律 。 这 意味 着 对 于 3 个 浮 点 数 a、b 和 c 有: 

(a+b) +c#¥a+(b+c) 

乘法 的 结合 律 有 同样 的 问题 。 虽 然 在 很 多 情况 下 左 侧 将 等 于 右 侧 ， 但 不 能 保证 总 是 这 样 。 

浮 点 运算 也 不 具备 分 配 律 : 
ax(b+c)A*¥ab+tac 

当 声 明 a =0.1、b=0.2 和 c=0.3 时 ,很 好 地 说 明了 上 述 不 等 式 , 虽然 结果 可 能 会 根据 编 

we ] 使 用 Cnu C tees 我 们 建议 您 男 外 找 3 个 浮 点 数 来 说 明 该 浮 点 运算 既 不 满 
足 结 合 律 也 不 满足 分 配 律 。 

这 对 程序 员 来 说 意味 着 什么 ”程序 员 在 对 浮 点 数 使 用 等 号 运算 符 时 应 该 要 格外 小 心 。 这 意 
味 着 应 该 避免 在 do. .. while 循环 和 for 循环 的 控制 循环 结构 中 使 用 它们 。 更 好 的 做 法 是 声 
明 “ 接 近 x” 的 epsilon( 例 如 ，epsilon =1.0x10-”)， 然 后 测试 绝对 值 。 

例如 ， 不 要 使 用 : 

4f XE CoN, 


最 好 使 用 : 


if(abs (x - 2) < epsilon) then...\\ 如 果 我 们 正确 定义 了 epsilon， 
\\ 这 就 足够 接近 ! 





浮 点 操作 还 是 浮 点 错误 


在 本 章 ， 我们 已 经 介绍 了 浮 点 数 及 计算 机 表示 它们 的 方法 。 pe 
(数值 分 析 的 研究 将 提供 这 一 主题 的 进一步 讨论 ) 和 浮 点 数 不 服从 标准 的 结合 律 和 分 配 律 。 
些 问 题 有 多 严重 ? 为 了 回答 这 个 问题 ， 我 们 介绍 3 个 重要 的 因 粗 心 造成 的 浮 点 错误 。 

1994 年 ， 当 Intel 推出 了 Pentium 站 下。 世界 各 地 的 数字 处 理 器 注意 到 有 一 些 奇怪 的 
事情 发 生 。 双 精度 除法 和 某 些 位 模式 的 计算 产生 了 不 正确 的 结果 。 虽 然 有 缺陷 的 芯片 对 一 些 数 
字 对 来 说 略 有 不 准确 ， 但 其 他 实例 更 极端 。 例 如 ， 如 果 * =4195 835、y =3 145 727， 发 现 z= 
x 一 (x/Yy) xy 应 该 产生 一 个 z=0 的 结果 。Intel 286 、386 和 486 芯片 给 出 了 正确 的 结果 。 考 虑 到 
浮 点 爸 入 误差 的 概率 , z 的 值 大 约 是 9.3 x10-"。 但 是 新 的 Pentium 处 理 器 给 出 的 结果 是 
z=2561 

Intel 获悉 这 个 问题 后 ， 经 研究 和 测试 后 表明 此 缺陷 是 芯片 设计 中 的 疏忽 。 这 个 处 理 器 为 快 
速 除法 使 用 了 基 为 4 的 数字 循环 算法 (radix -4 SRT 算法 ) ， 这 需要 一 个 有 1066 个 元 素 的 表 。 在 
硅 片 中 实现 这 个 表 ， 有 5 个 本 该 是 +2 的 表 项 写成 了 0。 

虽然 Pentium 的 缺陷 使 Intel 的 公共 关系 崩溃 ,但 对 那些 使 用 这 种 芯片 的 人 来 说 这 个 错误 还 
不 是 一 ey 事实 上 ， 相 比 浮 点 数 的 编程 错误 导致 石油 钻探 、 股 票 市 场 、 导 弹 防 御 领 域 灾 
难 ， 这 是 一 件 小 事情 。 由 浮 点 错误 导致 的 实际 灾害 的 列表 非常 长 。 以 下 两 个 实例 是 最 糟糕 的 。 
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在 1991 年 波斯 湾 战 争 期 间 ， 美 国 依靠 爱国 者 导弹 跟踪 和 拦截 了 巡航 导弹 和 飞毛腿 导弹 。 
其 中 一 个 导弹 没有 跟踪 到 一 个 进入 领空 的 飞毛腿 导弹 ， 让 飞毛腿 导弹 击 中 了 美国 军队 营房 ， 死 
亡 28 人 ， 受 伤 人 数 更 多 。 经 调查 后 确定 爱国 者 导弹 的 失败 是 由 于 使 用 的 精度 太 低 而 不 能 让 里 
弹 准确 地 确定 来 袭 的 飞毛腿 导弹 的 速度 。 

爱国 者 导弹 使 用 雷达 来 确定 物体 的 位 置 。 如 果 内 部 武器 控制 计算 机 将 物体 识别 为 应 被 拦截 
的 物体 ， 则 计算 预测 空域 ， 在 这 个 空域 中 目标 应 该 在 特定 的 时 间 点 上 定位 。 该 预测 基于 对 象 的 
已 知 速度 和 最 后 检测 的 时 间 。 

问题 在 时 钟 上 ， 它 以 1X10s 的 时 间 来 测量 。 但 是 从 系统 启动 以 来 的 时 间 都 被 存储 为 整数 秒 
(由 经 过 的 时 间 乘 以 1X10 确定 ) 。 为 了 预测 对 象 在 特定 时 间 内 将 在 哪里 ， 所 需 的 时 间 和 速度 应 
是 实数 。 将 整数 转换 为 实数 没有 问题 ， 然 而 ， 当 使 用 24 位 寄存 器 进行 计算 时 ， 爱 国 者 导弹 限 
制 了 这 种 操作 的 精度 。 当 用 二 进 制 表 示 1/10 时 ， 很 容易 看 到 潜在 的 问题 : 

0.0001100110011001100110011001100 . .. ' 

当 经 历 的 时 间 较 短 时 ,该 “截断 误差 ”不 明显 ， 不 会 产生 问题 。 爱 国 者 的 设计 是 运行 一 
次 仅仅 儿 分 钟 的 时 间 ， 因 此 24 位 精度 的 限制 应 该 是 无 足 轻重 的 。 问 题 是 在 海湾 战争 期 间 ， 导 
弹 系 统 持续 运行 了 几 天 。 导 弹 系 统 运行 时 间 越 长 ， 误 差 就 变 得 越 大 ， 并 且 预 测 计算 的 不 准确 性 
导致 不 成 功 截获 的 可 能 性 越 大 。 发 生 在 1991 年 2 月 25 日 的 事件 就 是 精度 问题 ， 当 时 由 于 浮 点 
数 精度 损失 ( 精度 要 求 ) 引起 的 失败 拦截 导致 了 28 人 死亡 。 据 估计 ， 爱 国 者 导弹 已 经 工作 了 
100h， 在 时 间 转 换 中 引入 约 0.34s 的 舍 入 误差 ，0. 34s 飞毛腿 导弹 可 以 飞行 大 约 半 公 里 的 行程 。 

设计 人 员 在 事件 发 生前 很 早 就 意识 到 转换 问题 。 然 而 ， 在 战 时 条 件 下 部 署 新 软件 并 不 容 
易 。 虽 然 新 的 软件 会 修复 错误 ， 但 是 现场 人 员 可 以 简单 地 通过 特定 的 间隔 重新 启动 系统 来 保持 
时 钟 值 足 够 小 ， 从 而 使 用 24 位 精度 就 足够 了 。 

浮 点 数 灾难 的 最 著名 的 例子 之 一 是 阿坝 亚 娜 5 号 火箭 的 爆炸 。1996 年 6 月 4 日 ， 欧 洲 航 
天 局 的 无 人 驾驶 的 阿 丽 亚 娜 5 号 运载 火箭 被 发 射 。 起 飞 后 40s， 火 箭 爆 炸 ， 在 法 属 圭 亚 那 的 
部 分 地 区 散落 着 价值 5 亿美 元 的 货物 。 调 查 显示 这 或 许 是 由 一 个 在 计算 机 科学 史上 最 具 破 坏 
性 的 粗心 而 直接 生效 的 软件 缺陷 所 导致 的 ， 即 浮 点 转换 错误 。 火 箭 的 内 部 参考 系统 将 64 位 
浮 点 数 (处理 火 箭 的 水 平 速度 ) 转换 为 16 位 有 符号 整数 。 但 是 ， 特 定 的 要 转换 的 64 位 浮 点 
数 大 于 32767(16 位 有 符号 数 可 表示 的 最 大 整数 ) ， 因 此 转换 过 程 失败 。 火 箭 试 图 对 从 来 没 
有 发 生 过 的 错误 转向 进行 即时 的 路 线 调 整 ， 因 此 制导 系统 关闭 了 。 讽 刺 的 是 ， 当 制导 系统 
关闭 时 ， 控 制 恢 复 到 安装 在 火箭 上 以 防 故 障 的 备用 单元 上 ， 但 备用 系统 运行 的 是 有 相同 缺 
陷 的 软件 。 

看 起 来 很 明显 ，64 位 浮 点 数 可 能 远 远 大 于 32767， 那么 火箭 程序 员 为 何 出 现 这 样 一 个 
明显 的 错误 ? 他 们 认为 速度 值 永 远 不 会 大 到 足以 成 为 一 个 问题 。 他 们 的 理由 是 以 前 火箭 的 
速度 从 来 没有 太 大 过 。 不 幸 的 是 ， 这 枚 火箭 比 以 前 的 所 有 火箭 都 快 ， 从 而 导致 速度 值 比 程 
序 员 预 期 的 要 大 。 程 序 员 犯 的 最 严重 的 错误 是 接受 了 旧 的 格言 “但 是 我 们 一 直 都 是 这 样 
做 的 ”。 \ 

计算 机 无 处 不 在 ， 在 洗衣 机 、 电 视 、 微 波 炉 甚至 汽车 中 。 我 们 当然 希望 为 汽车 做 编程 工 
作 的 程序 员 不 做 这 样 仓促 的 假设 。 在 所 有 下 线 的 新 车 中 大 约 有 15 ~60 个 微 处理 器 ， 在 商用 
飞机 和 医疗 设备 中 有 无 数 个 处 理 器 ， 对 浮 点 异常 深刻 的 理解 可 以 毫 不 夸张 地 说 就 是 在 保护 
生命 。 


2.6 字符 编码 
我 们 已 经 看 到 数字 计算 机 如 何 使 用 二 进 制 系统 来 表示 和 操作 数值 。 我 们 还 没有 考虑 这 些 内 
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部 值 如 何 转 换 为 对 人 类 有 意义 的 表示 。 这 种 方式 取决 于 计算 机 使 用 的 编码 系统 和 值 如 何 被 存储 


2.6.1 二 进 制 编码 的 十 进 制 


对 于 许多 应 用 程序 ， 我 们 需要 十 进 制 系统 的 精确 等 效 二 进 制 数 ， 这 意味 着 我 们 需要 对 十 进 
制 数字 的 每 位 进行 编码 。 在 许多 商业 应 用 程序 中 处 理 钱 数 正 是 这 种 情况 一 一 在 金融 交易 中 ， 当 
我 们 将 实数 转换 为 浮 点 数 时 ,我 们 不 能 承担 舍 入 误差 ! 

二 进 制 编码 的 十 进 制 (BCD) 在 电子 学 中 非常 普遍 ， 特 别 是 闹钟 和 计算 器 等 显示 数值 数据 
的 地 方 。BCD 将 十 进 制 数 的 每 位 数字 编码 为 4 位 二 进 制 形式 。 每 个 小 数 数字 被 单独 转换 为 等 价 
的 二 进 制 数 ， 如 表 2-5 所 示 。 例 如 ， 要 编码 146， 则 十 进 制 数字 将 分 别 替 换 为 0001 、0100 
和 0110。 

因为 大 多 数 计算 机 使 用 字 节 作为 最 小 的 访问 单位 ， 因 此 大 多 数值 存储 在 8 位 中 ， 而 不 是 4 
位 。 这 给 了 我 们 存储 4 位 BCD 数 的 两 个 选择 。 我 们 可 以 忽略 额外 位 的 成 本 ， 并 用 零 填充 高 阶 
半 字 节 ， 或 强制 将 每 位 十 进 制 数字 替换 为 8 位 。 当 使 用 这 种 方法 时 ，146 将 存储 为 00000001 
00000100 00000110。 显 然 ， 这 种 做 法 是 相当 浪费 的 。 第 二 种 方法 称 为 压缩 BCD ， 每 字 节 存 储 
两 位 数 。 压 缩 的 十 进 制 格式 允许 数字 有 符号 ， 不 是 将 符号 放 在 开始 处 而 是 把 它 存储 在 最 后 。 这 





个 “符号 数字 位 ”的 标准 值 若 为 1100 则 代表 + ，1101 代表 - ， 
+ 146 将 存储 为 00010100 01101100。 偶 数位 的 数字 仍然 需要 


表 2-5) 。 使 用 压缩 十 进 制 格式 ， 
填充 。 请 注意 ， 如 果 一 个 数字 有 一 个 小 数 点 (与 货币 值 
一 样 )， 则 它 在 BCD 表示 的 数字 中 不 存储 ， 应 该 由 应 用 
程序 保留 。 

BCD 的 另 一 个 变换 是 区 位 十 进 制 格式 。 区 位 十 进 制 
表示 在 每 个 字 节 的 低位 半 字 节 中 存储 一 个 十 进 制 数字 ， 
这 与 非 压缩 的 十 进 制 格式 相同 。 但 是 ， 它 不 使 用 零 的 半 
字 节 填补 高 阶 ， 而 是 使 用 特定 的 模式 。 称 为 数字 区 域 的 
高 阶 半 字 节 有 两 个 选择 。EBCDIC 区 位 十 进 制 格式 要 求 
该 区 域 全 部 为 1( 即 十 六 进 制 的 F) 。ASCII 区 位 十 进 制 
格式 要 求 区 域 为 0011( 十 六 进 制 为 3) 。( 有 关 EBCDIC 
和 ASCII 的 详细 说 明 ， 请 参阅 接 下 来 的 两 节 。) 两 种 格式 
都 允许 带 有 符号 数字 ( 使 用 表 2-5 中 的 符号 数字 ) ， 通 常 


1111 表示 值 为 无 符号 ( 见 


表 2-5 二进制 编码 的 十 进 制 


数字 


BN 


分 


区 


BCD 
0000 
0001 
0010 
0011 
0100 
0101 
0110 
0111 
1000 
1001 


一 一 一 一 一 一 一 一 一 





期 望 符号 位 于 最 低 有 效 字 节 的 高 位 半 字 节 ( 尽管 标记 可 111 
能 是 一 个 完 部 的 单 下 字 他 )。 例 如， 在 EBCDIC 区 位 于。 1200 a 


进 制 格式 中 ，+ 146 是 1111000111110100 11000110( 注 


意 ， 最 后 一 个 字 节 的 高 位 半 字 节 是 符号 ) 。 在 ASCI 区 位 十 进 制 格式 中 ， 


00110100 11000110。 
注意 表 2-5 中 有 6 个 未 使 用 的 可 能 的 二 进 制 值 





+ 146 是 00110001 


1010 ~ 1111。 虽 然 有 将 近 40% 的 值 浪费 


了 ， 但 我 们 在 准确 性 上 获得 了 相当 大 的 优势 。 例 如 ， 当 以 二 进 制 存储 时 ， 数 字 0. 3 是 重复 的 十 
进 制 数 。 截 断 到 8 位 分 数 时 ， 它 转换 回 0. 296 875, 约 有 1.05% 的 误差 。 在 EBCDIC 区 位 十 进 制 
BCD 中 ， 数 字 直 接 存储 为 1111 0011 (我 们 是 假设 数据 格式 暗示 了 小 数 点 ) ， 根 本 不 会 出 任何 
错误 。 

使 用 压缩 BCD 和 EBCDIC 区 位 十 进 制 分 别 表示 -1265. 

1265 的 4 位 BCD 表示 是 : 








0001 0010 0110 0101 
在 低 阶 位 后 添加 符号 并 在 高 阶 位 填充 0000， 我 们 有 : 


| oooo 0001 | oo10 0110 | ot01 1101 


EBCDIC 区 位 十 进 制 表示 需要 4 字 节 : 
1111 0001 1111 0010 | 1111 0110 | +1101 0101 | 


两 个 表示 中 的 阴影 部 分 为 符号 位 。 3 














2.6.2 EBGBIG 


在 IBM System/360 开发 之 前 ，IBM 使 用 了 6 位 变 体 的 BCD 用 于 表示 字符 和 数字 。 此 编 
码 严重 受 限于 它 如 何 表示 和 操作 数据 ， 小 写字 母 不 是 其 指令 的 一 部 分 。System/360 的 设计 人 
员 需 要 更 多 的 信息 处 理 能 力 以 及 统一 的 方式 存储 数字 和 数据 。 为 了 保持 与 早期 计算 机 和 外 
围 设备 的 兼容 性 ，IBM 工程 师 决定 将 BCD 从 6 位 扩展 到 8 位 是 最 好 的 选择 。 因 此 ， 这 个 新 
编码 称 为 扩展 二 进 制 编 码 十 进 制 交换 码 ( EBCDIC，Extended Binary Coded Decimal Inter- 
change Code) 。IBM 继续 在 其 大 型 机 和 中 型 计算 机 系统 中 使 用 EBCDIC。 然 而 ，IBM 的 AIX 
操作 系统 (在 RS/6000 及 其 后 续 产 品 中 可 以 找到 ) 和 IBM PC 操作 系统 使 用 ASCII。EBCDIC 编 
码 以 区 位 数字 形式 显示 在 表 2-6 中 。 字 符 通 过 将 数字 位 附加 到 区 域 位 来 表示 。 例 如 ， 在 EB- 
CDIC 中 字符 a 是 10000001， 数字 3 是 1111 0011。 请 注意 ， 大 写 和 小 写字 符 之 间 的 唯一 区 别 
是 第 二 位 ， 大 写 到 小 写 (反之 亦 然 ) 需 要 简单 地 翻转 一 位 。 区 位 也 使 程序 员 更 容易 测试 输入 
数据 的 有 效 性 。 


2.6.3 AScCll 


当 IBM 正 忙 于 建立 其 特 立 独行 的 System/360 时 ， 其 他 设备 制造 商 正 试图 制定 更 好 的 方法 
以 便 在 系统 之 间 传 输 数 据 。 美 国信 息 交 换 标准 码 (ASCII) 是 这 些 努 力 中 的 一 个 结果 。ASCII 直 
接 来 自 使 用 了 几 十 年 的 电 传 打 字 机 ( 电 传 ) 设 备 编码 方案 。 这 些 设备 使 用 从 Baudot 代码 派生 的 5 
位 (Murray) 代码， 该 代码 是 在 19 世纪 80 年 代 发 明 的 。 到 20 世纪 60 年 代 初 ，5 位 代码 的 局 限 
性 变 得 越 来 越 明 显 ， 国 际 标准 化 组 织 设计 了 7 位 编码 方案 ， 它 被 称 为 国际 电报 字母 表 5。1967 
年 ， 这 些 字母 的 衍生 物 成 为 我 们 现在 使 用 的 ASCII 的 官方 标准 。 

如 表 2-7 所 示 ，ASCII 定义 了 32 个 控制 字符 的 代码 、10 位 数字 、52 个 字母 (包括 大 写 和 小 
写 ) 、32 个 特殊 字符 (如 $ 和 #) 和 空格 字符 。 高 阶 (第 八 ) 位 用 于 奇偶 检验 。 

奇偶 校 验 是 所 有 错误 检测 方案 中 最 基本 的 。 它 很 容易 在 简单 的 设备 中 实现 ， 如 电 传 打字 
机 。 根 据 字 节 中 其 他 位 的 和 是 偶数 还 是 奇数 ， 奇 偶 校 验 位 被 设置 为 “ 开 ” 或 “ 关 ”。 例如 ， 如 
果 我 们 决定 使 用 偶 校 验 ， 并 且 发 送 了 ASCI 字符 A， 则 低 7 位 是 100 0001。 因 为 位 的 和 是 偶数 ， 
奇偶 校 验 位 将 被 设置 为 关 ， 我们 将 传送 0100 0001。 类 似 地 ， 如 果 我 们 传输 一 个 ASCII 学 符 C， 
则 为 100 0011 ， 在 我 们 发 送 8 位 字 节 之 前 ， 奇 偶 校 验 位 将 被 设置 为 开 ， 得 到 1100 0011。 奇 偶 校 
验 可 以 用 来 检测 1 位 错误 。 我 们 将 在 2.7 节 中 讨论 更 复杂 的 错误 检测 方法 。 

为 了 兼容 电信 设备 ， 计 算 机 制造 商 倾向 于 使 用 ASCII 码 。 然 而 ， 随 着 计算 机 硬件 变 得 越 来 
越 可 靠 ， 对 奇偶 校 验 位 的 需要 变 得 不 那么 重要 了 。 在 20 世纪 80 年 代 初期 ， 微 型 计算 机 和 其 周 
边 厂 商 开 始 使 用 奇偶 校 验 位 提供 在 128,。 ~ 255, 之 间 的 “扩展 ”字符 集 。 

根据 制造 商 的 不 同 ， 较 大 值 的 字符 可 以 是 从 数学 符号 到 方 框 外 形 和 外 语 字符 ( 如) 。 不 幸 
的 是 ， 没 有 什么 聪明 的 办 法 可 以 使 4SC17 成 为 一 个 真正 的 国际 交换 代码 。 
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2.6.4 Unicode 


EBCDIC 和 ASCII 都 是 围绕 拉丁 字母 构建 的 。 这 样 ， 它 们 对 使 用 非 拉丁 语 的 世界 上 大 多 数 
人 口 在 数据 表示 方面 受到 限制 。 当 所 有 国家 都 开始 使 用 计算 机 时 ， 每 个 国家 都 设计 出 了 最 有 效 
的 代表 他 们 母语 的 编码 ， 它 们 不 一 定 与 任何 其 他 编码 兼容 ， 这 在 新 兴 的 全 球 经 济 道路 上 设置 了 
另 一 个 障碍 。 


表 2-6 EBCDIC 码 (在 二 进 制 区 位 数字 格式 中 给 出 的 值 ) 


0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 1100 1101 1110 1111 
RLF SMM VT FF SO SI 

IRS IUS 

ACK BEL 











缩写 词 
NUL 空 TM ”磁带 标记 ETB 传输 块 结束 符 
SOH 头 部 开始 符 RES 恢复 ESC 退出 
STX ”文本 开始 符 NL 新 行 SM ”设置 方式 
ETX 文本 结束 符 BS 退 格 CU2 客户 使 用 2 
PF ”穿孔 结束 IL ”闲置 ENQ 查询 
HT ”水 平 制 表 符 CAN 取消 ACK 应 答 
LC 小 写 EM 介质 结束 符 BEL 振 铃 ( 嘟 嘟 声 ) 
DEL 删除 CC “光标 控制 SYN 同步 空闲 
RLF 反 向 换行 CU1 客户 使 用 1 PN ”穿孔 开始 
SMM 开始 手动 消息 IFS ”交换 文件 分 隔 符 RS ”记录 分 隔 符 
VT ”垂直 制 表 符 IGS ”交换 组 分 隔 符 UE， 头号 
FF ” 换 页 IRS ”交换 记录 分 隔 符 EOT 传输 终结 符 
CR ” 回 车 IUS ”交换 单元 分 隔 符 CU3 ”客户 使 用 3 
SO 移出 DS ”数字 选择 DC4 设备 控制 4 
SI 移入 SOS 有效 位 开始 符 NAK 否定 应 答 
DLE 转 义 FS ” 域 分 隔 符 SUB 替换 
DC1 设备 控制 1 BYP 旁 路 SP ”空格 
DC2 ”设备 控制 2 LF ”换行 














表 2-7 ASCII 码 ( 用 十 进 制 给 出 的 值 ) 





























0 NUL 16 DLE 32 48 0 64 @ 80 P 96 、 2 四 
1 SOH i "Bel 3 49 1 65 A 81 Q 97 &a 3 
2 STX 18 DC2 Ee 50 2 66 B 82 R 98 b 114 r 
3 ETX 13 DG3 3 才 Sl 池 ry 83 S 99 c ll5 s 
4 EOT 20 DC4 36 $ 2 - 活 68 D 3 100 dd 116 + 
| ENQ 21 NAK 37 % > | 69 E 85 U 101 e 117 u 
6 ACK 22 SYN 38 & 54 6 70 下 86 V 102 f 118 vy 
7 BEL 23 ETB 39 ， SS 7 71 G&G 87 W 3 省 119 w 
8 BS 24 CAN 40 ( 56 8 72， 晒 88 X 104 h 120 x 
9 HT 25 EM 41 ) 57 9 73: 89 YY 105 1 121 y 
10 LF 26 SUB 42 # SQ 7X4 J 90; 二 106 j 2 沁 
WN 2 ESC 43 + 59 ; 75 K 91 |[ LO0A EE 123 1 
1 Y 28. 15 44 ， 60 < wi 92 \ 108 1 124 | 
1 CE 29 GS 45 一 6 = 77 M 93 |] 109 m 125” 4 
14 SO 30 RS 46 . 9 78 N 94 “ 110 n 126 ~ 
1S “sl 31 US 47 / | 683 人 79 0 93 = bikE :2 i122 "DEE 
缩写 词 

NUL 空 DLE 转 义 

SOH ” 头 部 开始 符 DC1 ”设备 控制 

STX ”文本 开始 符 DC2 ”设备 控制 2 

ETX 文本 结束 符 DC3 ”设备 控制 3 

EOT ”传输 结束 符 DC4 ”设备 控制 4 

ENQ 查询 NAK 人 XIV 从 

ACK 应 答 SYN 同步 空闲 

BEL“ 振 铃 ( 哪 嘟 声 ) ETB 传输 决 结束 符 

BS 裔 格 a Re 

HT ”水 平 制 表 符 SUB 车 换 

LF 换行 ， 新 行 ESC 退 出 

VT ”垂直 制 表 符 FS ”文件 分 隔 符 

FF ” 换 页 新 页 GS ”组 分 隔 符 

CR ” 回 车 RS ”记录 分 隔 符 

SO 移出 US ”单元 分 隔 符 

5 徐 太 DEL ”删除 /闲置 





1991 年 ， 在 事情 还 没有 到 无 法 控制 之 前 ,成 立 了 一 个 由 行业 和 政府 领导 人 组 成 的 联盟 ， 
它 创 建 了 一 个 名 为 Unicode 的 国际 信息 交换 代码 。 这 个 组 织 被 称 为 Unicode 联盟 。 

Unicode 是 一 个 16 位 字母 表 ， 向 下 兼容 ASCII 和 拉丁 文 - 1 字符 集 。 符 合 ISO/IEC 10646 一 
1 国际 标准 字母 。 因 为 Unicode 的 基本 编码 是 16 位 ， 所 以 它 有 能 力 编码 世界 上 每 种 语言 中 使 用 
的 大 多 数字 符 。 如 果 这 还 不 够 ，Unicode 也 定义 了 一 个 允许 编码 其 他 百 万 个 字符 的 扩展 机 制 。 
这 足以 为 人 类 文明 史上 的 每 一 种 文字 提供 编码 。 

Unicode 代码 空间 由 5 部 分 组 成 ， 如 表 2-8 所 示 。 一 个 完整 的 符合 Unicode 的 系统 还 将 允许 
利用 单独 的 代码 形成 复合 字符 ， 如 : 和 A 的 组 合 形成 A' 。 这 些 复合 字符 使 用 的 算法 以 及 Uni- 
code 扩展 可 以 在 本 章 末 尾 的 参考 文献 中 找到 。 

虽然 Unicode 还 没有 成 为 美国 计算 机 专用 的 字母 表 ， 但 大 多 数 制造 商 正在 他 们 的 系统 中 对 
其 进行 一 些 有 限 的 支持 。Unicode 目前 是 Java 编程 语言 的 默认 字符 集 。 最 终 ， 所 有 制造 商 对 
Unicode 的 接受 程度 将 取决 于 他 们 希望 将 自己 定位 为 积极 的 国际 参与 者 有 ， 以 及 以 多 低 的 成 本 
生产 一 个 磁盘 驱动 器 以 支持 两 倍 ASCII 或 EBCDIC 存储 要 求 的 字母 表 。 
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表 2-8 Unicode 代码 空间 



































字符 集 措 还 5 1 | | 十 六 进 制 值 
字母 拉丁 语 、 斯 拉夫 语 、 和 希腊 语 等 8192 | 0000 ~ 1FFF 
符号 装饰 符 、 数 学 符号 等 4096 2000 ~2FFF 
CJK 汉语 、 日 语 和 韩语 音标 和 标点 符号 4096 3000 ~ 3FFF 
Han | 统一 的 汉语 、 日 语 和 韩语 40 960 4000 ~ DFFF 

字符 集 Han 的 扩展 或 溢出 4096 E000 ~ EFFF 
用 户 定 义 4096 FO00 ~ FFFE 





2.7 错误 检测 与 纠 错 


没有 通信 信道 或 存储 介质 可 以 完全 无 错误 。 这 在 物理 上 是 不 可 能 的 。 随 着 传输 速率 的 增 
加 ， 位 传输 变 得 更 紧密 ， 随 着 每 平方 毫米 存储 空间 可 以 保存 更 多 位 ， 磁 通 量 密度 也 增加 了 。 错 
误 率 与 每 秒 传输 的 位 数 或 每 平方 毫米 磁 存 储 器 的 位 数 成 正比 。 

在 2.6.3 节 中 ,我 们 提 到 可 以 将 一 个 奇偶 校 验 位 添加 到 ASCI 字 节 中 以 帮助 检测 传输 
过 程 中 是 否 有 已 损坏 的 位 。 这 种 错误 检测 方法 的 有 效 性 具有 局 限 性 : 简单 的 奇偶 校 验 只 
能 检测 到 每 个 字 节 中 的 奇数 个 错误 。 如 果 发 生 两 个 错误 ， 我 们 无 法 检测 出 。 不 正确 的 数 
据 被 误 认 为 是 正确 的 数据 。 如 果 这 种 错误 发 生 在 发 送 财务 信息 或 程序 代码 中 ,结果 可 能 
是 灾难 性 的 。 

当 你 阅读 下 面 的 部 分 时 ， 你 应 该 记 住 创 建 无 差错 介质 是 不 可 能 的 ，1009% 的 检测 或 者 纠正 
在 介质 中 出 现 的 错误 也 是 不 可 能 。 错 误 检测 和 纠 错 是 在 设计 计算 机 系统 时 必须 进行 的 另 一 项 研 
究 。 因 此 ， 构 建 良好 的 错误 控制 系统 是 在 合理 的 经 济 范围 内 检测 或 纠正 “合理 ”数量 “合理 ” 
预期 错误 的 系统 。( 注 : 单词 “合理 ”是 由 实现 决定 的 。) 


2.7.1 循环 元 余 校 验 


校 验 和 用 于 各 种 各 样 的 编码 系统 ， 从 条 形 码 到 国际 标准 图 书 编号 。 这 些 都 是 自 检 码 ， 它 们 
可 以 很 快 地 显示 前 一 个 数字 是 否 被 误 读 了 。 循 环 宛 余 校 验 (CRC) 是 一 种 校 验 和 ， 它 主要 用 于 
确定 在 数据 通信 中 在 大 的 数据 块 或 信息 字 节 流 内 是 否 发 生 了 错误 。 要 检查 的 数据 块 越 大 ， 提 供 
足够 保护 的 校 验 和 也 就 越 大 。 校 验 和 和 循环 兄 余 校 验 是 两 种 类 型 的 系统 错误 检测 方案 ， 这 意味 
着 错误 检查 位 被 附加 到 原始 信息 字 节 上 了 。 该 组 错误 检查 位 称 为 特征 位 。 添 加 错误 校 验 位 ， 原 
始 信息 字 节 不 会 改变 。 
在 循环 元 余 校 验 中 ,“ 循 环 ” 这 个 词 是 指 这 种 错误 控制 系统 背后 的 抽象 的 数学 理论 。 虽 然 
这 个 理论 的 讨论 超出 了 本 文 的 范围 ， 但 是 我 们 可 以 演示 该 方法 是 如 何 工 作 的 ， 以 帮助 理解 它 经 
济 地 检测 传输 错误 的 能 力 。 
模 2 运算 
你 可 能 会 熟悉 超过 一 个 模 数 的 整数 运算 。 每 天 告诉 你 时 间 的 十 二 小 时 的 钟表 是 一 个 模 数 为 
12 的 系统 。 当 我 们 给 11:00 加 上 2 小 时 ， 我 们 得 到 1:00。 模 2 运算 使 用 两 个 不 借 位 或 不 进位 的 
二 进 制 操作 数 ， 结 果 同 样 是 二 进 制 数 ， 也 是 模 2 系统 的 一 个 成 员 。 由 于 加 法 中 闭 包 和 人 恒 等 元 素 
的 存在 ， 数 学 家 说 这 个 模 2 系统 形成 了 一 个 代数 场 。 
加 法 规则 如 下 : 
0 +0=0 
0+1=1 





1+0=1 
1+1=0 


计算 1011, 和 110, 的 模 2 和 。 


| 
十 110( 模 2) 


Os 
这 个 总 和 仅 在 模 2 运算 中 有 意义 。 4 
模 2 除法 是 通过 使 用 模 2 加 法 规则 进行 一 系列 部 分 和 的 运算 。 例 2. 39 说 明了 该 过 程 。 
计算 1001011, 除 以 1011, 的 商 和 余数 。 


1011 J10010IT 1. 在 被 除数 的 第 一 位 下 直接 写 
1011 除 
0010 ”2. 使 用 模 2 加 法 把 这 些 数字 相 加 
3. 从 被 除数 中 落下 各 两 位 ， 使 差 
的 第 一 个 1 可 以 与 除数 的 第 一 
001001 个 1 对 齐 
14011 4. 按照 步骤 1 复制 除数 
0010 5. 按照 步骤 2 做 加 法 
00101 6 落下 另 一 位 
7. 由 于 101, 不 能 被 1011, 整 除 ， 
所 以 是 余数 


商 为 1010,。 看 

模 2 域 上 的 算术 运算 有 等 价 的 多 项 式 ， 它 们 类 似 于 整数 域 上 的 多 项 式 。 我 们 已 经 看 到 位 置 
数字 系统 如 何 表示 增加 的 基数 指数 。 例 如 : 

1011 =1 x 0X LX2 FT, 
通过 让 X=2， 二 进 制 数 1011, 可 成 为 多 项 式 的 缩写 : 
1 
这 样 ， 在 例 2.39 中 的 除法 就 变 为 多 项 式 运算 : 
| 
和 二 对 

计算 和 使 用 CRC 

在 进行 了 如 上 宛 长 的 介绍 后 ， 我 们 下 面 将 通过 一 个 具体 的 例子 来 展示 如 何 构造 CRC : 

1. 假设 信息 字 节 71=1001011,。( 可 以 使 用 任意 数量 的 字 节 形成 消息 块 。) 

2. 发 送 方 和 接收 方 同意 任意 二 进 制 模 式 ， 如 P=1011,。( 以 1 开始 和 结束 的 模式 卫 作 得 
最 好 。) 

3. 了 向 左 移动 一 个 小 于 P 中 的 位 数 ， 给 出 一 个 新 的 了 =1001011000,。 

4. 使 用 I 作为 被 除数 和 PP 作为 除数 ,执行 模 2 除法 (如 例 2.39 所 示 )。 我 们 忽略 商 ， 并 注 
意 余数 是 100, 。 这 个 余数 就 是 实际 的 CRC 校 验 和 。 

5. 将 余数 与 1 相 加 ， 给 出 消息 M: 

1001011000, + 100, = 1001011100， 
6. 消息 接收 方 使 用 相反 的 过 程 对 M 进行 解码 和 检查 。 直 到 M 被 P 整除: 
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1010100 
1011 ) 1001011100 
1011 
001001 
1011 
0010 
001011 
1011 


0000 


注意 : 相反 的 过 程 将 包括 附加 的 余数 。 

非 零 的 余数 表示 在 M 的 传输 中 发 生 了 错误 。 当 使 用 大 的 多 项 式 时 ， 该 方法 效果 最 好 。 为 
此 广泛 使 用 4 种 标准 多 项 式 : 

SGRCECGTTGTEUD Ts 

RC 生计 

® JICRC =16CANSI): ZY 二 半生 ] 

SORE 下 机 汪 天 和 相关 本 和 天 下 而 汪 直 是 下 且 下 尖 本 汪 二 

CRC -CCITT、CRC -12 和 CRC - 16 在 一 对 字 节 上 操作 ; CRC -32 使 用 4 字 节 ， 它 适用 于 
32 位 字 的 系统 操作 。 已 经 证 明了 使 用 这 些 多 项 式 的 CRC 可 以 检测 超过 99. 8% 单个 位 的 错误 。 

可 以 使 用 查找 表 有 效 地 实现 CRC， 而 不 是 用 每 个 字 节 计算 余数 。 每 个 可 能 的 输入 位 模式 生 
成 的 余数 可 以 直接 “ 烧 ” 到 通信 和 存储 电子 器 件 中 。 与 16 或 32 个 周期 的 除法 操作 相 比 ， 用 一 
个 周期 查找 表 就 可 以 找到 余数 。 显 然 ， 这 需要 在 速度 和 更 复杂 的 控制 电路 的 成 本 之 间 进 行 
权衡 。 


2.7.2 汉 了 明码 


与 磁盘 系统 相 比 ， 数 据 通信 通道 更 容易 出 错 ， 同 时 也 更 能 容忍 错误 。 在 数据 通信 中 ， 只 要 有 
检测 错误 的 能 力 就 可 以 。 如 果 通 信 设 备 确定 一 个 消息 包含 一 个 错误 位 ， 那 么 它 要 做 的 就 是 请 求 重 
传 。 存 储 系统 和 主 存 没 有 这 么 奢侈 。 磁 盘 有 时 可 以 是 一 个 金融 交易 或 其 他 不 可 重 现 的 实时 数据 集 
合 的 唯一 存储 库 。 因 此 ， 存 储 设备 和 主 存 必须 具备 不 仅 可 以 检测 还 能 纠正 一 定数 量 错误 的 能 力 。 

错误 恢复 编码 在 过 去 一 个 世纪 已 被 深入 研究 。 汉 明码 是 最 有 效 的 编码 之 一 ， 也 是 最 老 的 编 
码 。 汉 明码 是 对 奇偶 校 验 概念 的 改进 ， 可 以 提升 错误 检测 和 校正 能 力 ， 添 加 到 信息 字 中 的 奇偶 
校 验 位 的 数量 会 成 比例 地 增加 。 在 可 能 发 生 随机 错误 的 情况 下 使 用 汉 明 码 。 对 于 随机 错误 ， 我 
们 假定 每 位 的 失败 具有 固定 的 发 生 概率 ， 且 与 其 他 位 故障 无 关 。 计 算 机 主 存 通常 会 遇 到 这 样 的 
错误 ， 所 以 在 下 面 的 讨论 中 ， 我 们 会 在 主 存 位 错误 检测 和 纠正 的 环境 下 介绍 汉 明码 。 

汉 明 码 使 用 的 奇偶 校 验 位 也 称 为 校 验 位 或 元 余 位 。 存 储 器 字 本 身 由 m 位 组 成 , 但 是 考虑 
到 错误 检测 和 纠正 增加 了 7 位 元 余人 位。 因此， 最 后 的 字 叫 作 码 字 ， 是 一 个 包含 m 个 数据 位 和 7 
个 校 验 位 的 位 单元 。 每 个 数据 字 是 由 n=m+r 位 组 成 的 唯一 码 字 ， 如 下 所 示 : 


| m 位 | "位 | 








汉 明 距离 是 指 在 两 个 码 字 中 有 和 多少 位 不 同 。 例 如 ， 如 果 我 们 有 以 下 的 两 个 码 字 : 
10001001 
10110001 
米 炒 六 


7 第 2 章 





我 们 看 到 它们 有 3 个 位 置 (由 * 标记 ) 不 同 ， 所 以 这 两 个 码 字 的 汉 明 距离 是 3。( 请 注意 ， 
还 没有 讨论 过 如 何 创建 码 字 ， 我 们 会 尽快 做 这 件 事 。) 

两 个 码 字 之 间 的 汉 明 距离 在 错误 检测 的 环境 中 很 重要 。 如 果 两 个 码 字 的 汉 明 距离 为 4， 那 
么 将 一 个 码 字 转 换 到 另 一 个 码 字 有 d 位 单位 错误 的 情况 就 不 会 被 检测 到 。 因 此 ， 如 果 我 们 希望 
创建 一 个 编码 ， 它 可 以 保证 检测 到 所 有 位 的 错误 (1 位 一 个 错误 ) ， 那 么 任何 两 个 码 字 之 间 的 汉 
明 距离 必须 至 少 为 2。 如 果 认为 一 个 n 位 字 不 是 合法 的 码 字 ， 那 么 这 个 码 字 就 被 认为 是 一 个 错 
误 的 码 字 。 

若 给 定 一 个 计算 校 验 位 的 算法 ， 则 可 以 构建 完整 合法 的 码 字 列 表 。 在 这 个 编码 中 所 有 两 个 
码 字 之 间 的 最 小 汉 明 距离 称 为 编码 的 最 小 汉 明 距离 。 编 码 的 最 小 汉 明 距离 通常 由 符号 D( min ) 
表示 ， 它 可 以 决定 其 错误 检测 和 纠正 能 力 。 简 单 来 说 ， 对 于 任何 码 字 XX 若 想 被 接收 为 男 一 个 有 
效 的 码 字 Y， 则 在 庆 中 必须 出 现 至 少 D( min) 个 错误 。 因 此 ， 为 了 检测 (或 更 少 ) 位 错误 ， 该 码 
的 汉 明 距离 必须 为 D(min) =k+1。 汉 明码 可 以 始终 检测 D(min) -1 个 错误 并 纠正 L(D(min) - 
1)/2 个 错误 ”。 因 此 ， 代 码 的 汉 明 距离 必须 至 少 为 2k+1 以 能 够 纠正 大 个 错误 。 

码 字 由 使 用 7 个 奇偶 校 验 位 的 信息 字 构 成 。 在 我 们 继续 讨论 错误 检测 和 纠正 之 前 ， 来 看 一 
个 简单 的 例子 。 最 常见 的 错误 检测 使 用 附加 到 数据 上 的 单个 奇偶 校 验 位 ( 回顾 关于 ASCII 字符 
表示 的 讨论 ) 。 在 这 个 码 字 的 任何 一 位 中 ， 一 位 错误 会 产生 错误 的 奇偶 校 验 。 

假设 存储 器 具有 2 个 数据 位 和 1 个 附加 在 码 字 尾部 的 偶 校 验 位 ( 因此 码 中 1 数量 
必须 为 偶数 ) 。 有 2 个 数据 位 ， 共 有 4 个 可 能 的 字 。 我 们 这 里 列 出 数据 字 、 对 应 的 奇偶 校 验 位 
以 及 为 这 4 个 可 能 字 中 的 每 一 个 产生 的 码 字 : 























得 到 的 码 字 有 3 位 。3 位 允许 有 8 种 不 同 的 位 模式 ， 如 下 所 示 ( 有 效 码 字 用 * 标记 ) : 


000* 100 
001 101* 
010 [0 


Te | 




















如 果 遇 到 码 字 001， 则 它 是 无 效 的 ， 因 为 它 表 示 出 错 已 经 发 生 在 码 字 的 某 个 地 方 。 例 如 ， 
假设 存储 在 存储 器 中 的 正确 码 字 为 011， 但 是 一 个 错误 使 码 字 变 为 001。 这 个 错误 可 以 检测 到 ， 
但 无 法 纠正 。 不 可 能 确切 地 确定 有 几 位 发 生 了 翻转 ， 即 指明 哪些 位 是 错误 的 。 纠 错 码 需要 多 于 
1 位 的 奇偶 校 验 位 ， 如 下 讨论 所 示 。 a 

如 果 有 效 的 码 字 受到 两 位 错误 的 影响 ， 则 上 述 示例 会 发 生 什么 ”例如 ， 假 设 码 字 内 011 转 
换 成 000。 这 个 错误 不 能 检测 到 。 如 果 检查 上 述 示 例 中 的 代码 ， 将 看 到 D( min) 是 2， 这 意味 着 
该 代码 仅 能 保证 检测 单个 位 的 错误 。 

我 们 已 经 说 过 了 一 个 编码 的 错误 检测 和 纠正 能 力 取决 于 D( min) ， 从 错误 检测 的 角度 来 看 ， 
我 们 在 例 2.40 中 已 经 看 到 了 这 种 关系 。 纠 错 需 要 该 编码 包含 额外 的 宛 余 位 ， 如 果 编 码 是 检测 





日 符号 | 」 表 示 向 下 取 整 的 函数 ， 是 小 于 等 于 这 个 括 起 来 的 数 的 最 大 整数 。 例 如 ,| 8.3 ]=8 和 |8.9 ]=8。 
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和 纠正 大 个 错误 ， 那 么 应 确保 最 小 汉 明 距 离 DCmin) =2k +1。 这 种 汉 明 距 离 保证 所 有 合法 的 码 
字 都 有 足够 远 的 距离 ， 即 使 有 个 变化 ， 得 出 的 无 效 码 字 也 更 接近 一 个 唯一 有 效 的 码 字 。 这 是 
很 重要 的 ， 因 为 纠 错 中 使 用 的 方法 是 将 无 效 码 字 转 换 为 不 同位 数 最 少 的 有 效 码 字 。 在 例 2.41 
中 说 明了 这 个 想法 。 
人 ED 假设 我 们 有 以 下 代码 (不 用 担心 如 何 生成 此 代码 ,我 们 很 快 就 会 解决 这 个 
问题 ) : 
00000 
8 0OL 
LL OL 
11101 
首先 ， 我 们 来 确定 D(min) 。 通 过 检查 所 有 可 能 的 码 字 对 ， 我 们 发 现 最 小 汉 明 距离 D( min) 
=3。 因 此 ， 这 段 代码 最 多 可 以 检测 两 个 错误 并 纠正 1 位 错误 。 如 何 纠正 ?假设 我 们 读 取 的 无 
效 码 字 是 10000。 它 必须 至 少 有 一 个 错误 ， 因 为 这 与 任何 有 效 码 字 都 不 匹配 。 我 们 现在 确定 码 
字 与 每 个 合法 码 字 之 间 的 汉 明 距离 : 它 与 第 一 个 码 字 有 1 位 不 同 ， 与 第 二 个 是 4 位 ， 与 第 三 个 
是 2 位 ， 与 最 后 一 个 是 3 位 。 因 此 可 生成 一 个 差异 向 量 [1，4，2，3] 。 要 想 对 此 码 字 进 行 更 
正 ， 我 们 使 用 最 接近 的 合法 码 字 自动 更 正 ， 从 而 修正 为 00000。 请 注意 ， 此 “修正 ”不 一 定 正 
确 ! 我 们 假设 发 生 了 最 小 数量 的 可 能 错误 ， 即 1 个 可 能 的 错误 。 原 始 码 字 可 能 为 10110， 当 发 
生 两 个 错误 时 可 能 变 为 10000。 
假设 确实 发 生 了 两 个 错误 。 例 如 ， 假 设 我 们 读 取 的 无 效 代码 字 是 11000。 如 果 我 们 计算 的 
距离 向 量 为 [2，3，3，2] ,我 们 看 到 没有 “最 近 ” 的 码 字 ， 无 法 进行 修正 。 如 本 例 所 示 ， 如 
果 发 生 多 个 错误 ， 最 小 汉 明 距离 3 允许 只 校正 一 个 错误 ， 并 且 不 能 保证 纠正 。 4 
在 我 们 的 讨论 中 ,已 经 简单 介绍 了 各 种 各 样 的 编码 ,但 没有 给 出 如 何 生成 编码 的 任何 细 
节 。 用 于 生成 编码 的 方法 有 很 多 种 ， 也 许 更 直观 的 方法 之 一 是 用 于 编码 设计 的 汉 明码 算法 ,我 
们 现在 介绍 它 。 在 解释 算法 的 实际 步骤 之 前 ， 我 们 会 介绍 一 些 背 景 资料 。 
假设 我 们 希望 设计 的 代码 包含 m 个 数据 位 和 7+ 个 校 验 位 ， 它 允许 修正 单个 位 错误 。 这 意味 
着 有 2" 个 合法 的 码 字 ， 每 个 都 有 唯一 的 校 验 位 组 合 。 因 为 我 们 专注 于 单个 位 错误 ， 所 以 来 检 
查 一 组 无 效 码 字 与 所 有 合法 码 字 距 离 为 1 的 字 。 
每 个 有 效 码 字 都 有 位， 并且 这 些 位 都 可 能 会 出 现 错误 。 因 此 ， 每 个 有 效 码 字 有 n 个 距离 
为 1 的 非法 码 字 。 因 此 ， 如 果 我 们 关心 每 一 个 合法 码 字 和 每 一 个 由 一 个 错误 组 成 的 无 效 码 字 ， 
我 们 会 得 到 与 每 个 码 字 相 关联 的 n+1 个 位 模式 (1 个 合法 字 和 n 个 不 合法 的 字 ) 。 因 为 每 个 码 
字 由 4 位 组 成 ,其 中 n=m+r， 所 以 总 共 可 能 有 2" 个 位 模式 。 得 到 以 下 不 等 式 : 
(Nt 1) x 
其 中 n+1 是 每 个 码 字 的 位 模式 的 数量 ，2" 是 合法 码 字 的 数量 ，2" 是 可 能 位 模式 的 总 数 。 
因为 n=m+r， 所 以 我 们 可 以 将 不 等 式 重 写 为 : 


(mtr+l1) X22 








或 者 
(m+r+1)=<2" 
这 个 不 等 式 是 很 重要 的 ， 因 为 它 规定 了 所 需 检查 位 数量 的 下 限 (我 们 总 是 尽 可 能 少 地 使 用 
检查 位 ) 来 构造 一 个 具有 m 个 数据 位 和 7 个 校 验 位 的 代码 ， 它 可 校正 所 有 单个 位 错误 。 
假设 我 们 有 长 度 m=4 的 数据 字 ， 然 后 : 
(4+r+1)=<2" 
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这 意味 着 "必须 大 于 或 等 于 3。 我 们 选择 + =3。 这 意味 着 要 建立 一 个 4 位 数据 字 的 代码 ， 

它 应 该 能 纠正 单个 位 的 错误 ， 我 们 必须 添加 3 个 校 验 位 。 

汉 明 算法 

汉 明 算法 为 设计 编码 纠正 单个 位 错误 提供 了 -一 种 简单 的 方法 。 要 为 任何 大 小 的 内 存 字 构 千 
纠 错 代 码 ， 请 按照 下 列 步骤 操作 : 

1. 确定 编码 所 需 的 校 验 位 数 r， 然 后 为 4 个 位 (其 中 n=m+7) 编 号 ,， 从 右 到 左 ， 以 1( 不 是 
0) 开 始 。 

2. 位 数 为 2 的 寡 的 位 是 奇偶 校 验 位 ， 其 他 是 数据 位 。 

3. 分 配 奇偶 校 验 位 以 检查 位 的 位 置 ， 如 下 所 示 : 位 4 是 被 奇偶 校 验 位 b, ，b,，…，5 检 查 
的 ， 即 b+b,+…+b=b( 其 中 “+” 表 示 模 2 的 和 )。 

我 们 现在 举 一 个 例子 说 明 这 些 步骤 和 纠 错 的 实际 过 程 。 

人 多 使 用 刚刚 描述 的 汉 明 码 和 偶数 校 验 位 编码 8 位 的 ASCII 字符 K。( 高 阶 位 将 为 
零 ) ， 引 入 一 个 单个 位 错误 ， 然 后 指示 如 何 定位 错误 。 

我 们 首先 确定 K 的 码 字 。 

步骤 1: 确定 必要 的 校 验 位 的 位 数 ， 将 这 些 位 加 到 数据 位 中 ， 并 给 所 有 的 位 编号 。 

因为 m =8， 所 以 有 (8 +r+1) <2"， 这 意味 着 7 必须 大 于 或 等 于 4。 我 们 选择 r=4。 

步骤 2: 从 1 开始 从 右 到 左 编 号 位 数 ， 结 果 是 : 












































本 大 下 
奇偶 校 验 位 用 框 标记 。 
步骤 3: 分 配 奇偶 校 验 位 以 检查 不 同位 的 位 置 。 
为 了 执行 这 一 步 ， 我 们 首先 将 所 有 位 的 位 置 写成 2 的 寄 的 和 : 





l=:l 5=1+4 9=1+8 
爷 三 六 6=2+4 10=2+8 
3=1+2 7=1+2+4 11=1+2+8 
4 = 和 4 8 三 8 12 =4+8 


数字 1 包含 在 位 置 1、3、5、7、9 和 11 中 ， 因 此 ， 这 个 奇偶 校 验 位 将 反映 这 些 位 置 中 位 的 
奇偶 性 。 类 似 地 ，2 包含 在 位 置 2、3、6、7、10 和 11 中 ， 因 此, 位置 2 中 的 奇偶 位 反映 了 这 
组 位 的 奇偶 性 。 位 置 4 为 位 置 4、5、6、7 和 12 提供 奇偶 校 验 ,位 置 8 为 位 置 8、9、10、11 和 
12 提供 奇偶 校 验 ， 如 果 在 非 框 空白 处 写 数据 位 ， 然 后 加 入 奇偶 校 验 位 ， 我 们 得 到 以 下 的 码 字 
结果 : 








0 1 全 站 1 
1911 10 9 训 
因此 ， 字 符 K 的 码 字 为 010011010110。 
我 们 在 ,位 置 引入 一 个 错误 ， 生 成 码 字 010111010110。 如 果 我 们 使 用 奇偶 校 验 位 来 检查 不 
同位 组 ， 可 以 发 现 有 以 下 结果 。 
位 置 1 检查 位 置 1、3、5、7、9 和 11: 使 用 偶 校 验 位 ， 这 会 产生 错误 。 
位 置 2 检查 位 置 2、3、6、7、10 和 11: 这 是 正确 的 。 
位 置 4 检 查 位 置 4、5、6、7 和 12: 这 是 正确 的 。 
位 置 8 检查 位 置 8、9、10、11 和 12: 这 会 产生 一 个 错误 。 
奇偶 校 验 位 1 和 8 显示 错误 。 这 两 个 奇偶 校 验 位 都 检查 位 置 9 和 11， 所 以 单个 位 错误 一 定 
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在 位 置 9 或 11 中 。 但 是 ， 因 为 位 置 2 也 检查 了 位 置 11， 并 表示 在 其 检查 的 位 的 子 集中 没有 发 
生 错 误 ， 所 以 错误 必然 发 生 在 位 置 9。( 我 们 知道 这 个 错误 ， 因 为 这 个 错误 是 我 们 造成 的 。 但 
是 ， 请 注意 ， 即 使 我 们 不 知道 错误 在 哪里 ， 使 用 这 个 方法 也 能 确定 错误 的 位 置 并 通过 简单 地 翻 
转 位 来 纠正 错误 。) 

根据 奇偶 位 被 定位 的 方式 ， 检 测 和 纠正 错误 位 的 一 个 更 简单 的 方法 是 把 表示 错误 的 奇偶 校 
验 位 的 位 置 相 加 。 我 们 发 现 奇 偶 校 验 位 1 和 8 产生 了 一 个 错误 ， 且 1 +8 =9， 这 正 是 发 生 错 误 
的 地 方 。 本 

人 PE 多 使 用 汉 明 算法 查找 3 位 存储 字 的 所 有 码 字 ， 假 设 使 用 奇 校 验 。 

我 们 有 8 个 可 能 的 字 : 000，001,，010, 011，100，101，110 和 111。 首 先 需要 确定 所 需 的 
校 验 位 数 。 因 为 m=3， 所 以 有 (3 +r+1)< 生 2， 这 意味 着 "必须 大 于 或 等 于 3。 我 们 选择 r=3。 
因此 ， 每 个 码 字 都 有 6 位 ， 并 且 校 验 位 在 位 置 1、2 和 4， 如 下 所 示 : 


OD | 
和 




















从 以 前 的 例子 中 我 们 知道 : 

e 位 置 1 检查 位 置 1、3 和 5 的 奇偶 性 
e 位 置 2 检查 位 置 2、3 和 6 的 奇偶 性 
e 位 置 4 检查 位 置 4、5 和 6 的 奇偶 性 
因此 ， 我 们 为 每 个 内 存 字 提供 以 下 码 字 : 


人 
000 二 进 制 位 的 位 置 二 全 中 DO 
001 二 进 制 位 的 位 置 下 二 和 9 a 
010 二 进 制 位 的 位 置 二 三 二 二 
011 二 进 制 们 的 位 置 二 二 = 轩 U 
100 二 进 制 位 的 位 置 一 二 四 二 二 
101 == 进 制 位 的 位 置 上 了 加 二 电台 
110 二 进 制 位 的 位 置 一 十 上 四 四 
111 二 进 制 位 的 位 置 一 三 2: 二 上 


我 们 的 码 字 集合 是 001011 、001100、010010、010101、100001 、100110、111000、111111。 
如 果 其 中 任何 一 个 字 的 某 一 位 被 翻转 ， 我 们 可 以 准确 地 确定 是 哪个 位 翻转 并 改正 它 。 例 如 ， 要 
发 送 111， 我 们 实际 发 送 代码 字 111111。 如 果 接 收 到 110111， 则 奇偶 校 验 位 1( 它 检查 位 置 1、 
3 和 5) 是 对 的 ， 奇 偶 校 验 位 2( 它 检查 位 置 2、3 和 6) 是 对 的 ， 但 是 奇偶 校 验 位 4 显示 错误 ， 因 
为 只 有 位 置 5 和 6 是 1， 这 违反 了 奇 校 验 。 位 置 5 不 可 能 不 正确 ， 因 为 奇偶 校 验 位 1 检查 是 正 
确 的 。 位 置 6 不 可 能 错误 ， 因 为 奇偶 校 验 位 2 检查 是 正确 的 。 因 此 ， 位 置 4 是 错误 的 ， 所 以 它 


对 :种 2 划 








应 从 0 变 为 1， 得 到 正确 的 码 字 111111。 本 
在 下 一 章 中 ， 您 将 看 到 使 用 简单 的 二 进 制 电路 实现 一 个 汉 明 码 是 多 么 容易 。 由 于 其 简单 
性 ， 所 以 可 以 廉价 地 加 入 汉 明 码 保护 并 且 对 性 能 影响 很 小 。 


2.7.3 里 德 - 所 罗 门 纠 错 码 


汉 明 码 在 期 望 错 误 很 少 的 情况 下 工作 得 很 好 。 固 定 磁 盘 驱动 器 的 错误 等 级 为 亿 分 之 一 位 。 
我 们 刚刚 研究 的 3 位 汉 明 码 很 容易 纠正 这 种 类 型 的 错误 。 然 而 ， 在 有 多 个 相 邻 位 被 损坏 的 情况 
下 ， 汉 明码 是 无 用 的 。 这 种 类 型 的 错误 称 为 突 发 错误 。 由 于 接触 不 当 和 环境 压力 ， 在 可 移动 介 
质 ( 如 磁带 和 光盘 上 ) 突 发 错误 是 常见 的 。 

如 果 我 们 预料 错误 发 生 在 块 中 , 那么 就 应 该 使 用 一 个 在 块 级 别 上 工作 的 纠 错 代码 ， 而 不 是 
在 位 级 别 上 工作 的 汉 明 码 。 可 以 认为 里 德 - 所罗门 (RS ) 纠 错 码 是 一 种 CRC， 它 对 整个 字符 进 
行 操作 而 不 是 只 对 几 个 位 进行 操作 。RS 码 像 CRC 一 样 ， 具 有 系统 性 ， 即 奇偶 校 验 字 节 附加 到 
一 个 信息 字 节 块 上 。 使 用 以 下 参数 定义 RS(n, 有 ) 码 : 

e ;为 字符 (或 “符号 ”) 中 的 位 数 

e 上 为 ;位 字符 包含 的 数据 块 数 

e nn 为 码 字 中 的 位 数 

RS(n, 上 〖) 能 够 纠正 有 个 信息 字 节 中 的 (n -有 )/2 个 错误 。 

因此 ， 流 行 的 RS(255，223 ) 码 使 用 223 个 8 位 信息 字 节 和 32 个 特征 字 节 以 形成 有 255 字 
节 的 码 字 。 它 会 纠正 信息 块 中 的 16 个 错误 字 节 。 

RS 码 的 生成 多 项 式 是 由 一 个 定义 在 伽 罗 华 域 的 抽象 数学 结构 上 的 多 项 式 给 出 。( 对 伽 罗 华 
的 具体 讨论 超出 了 本 书 的 范围 。 见 本 章 结 尾 处 的 参考 资料 。) RS 生成 多 项 式 为 : 

a(x) =(o 0) (sa" )-(w 0 ) 

其 中 4=n--k; x 是 整个 字 节 (或 符号 ) ; g(x) 工 作 在 域 GF(2') 上 。( 注意: 这 个 多 项 式 是 
在 伽 罗 华 域 上 展开 的 ， 这 与 普通 代数 使 用 的 整数 域 有 很 大 不 同 ) 

使 用 以 下 公式 计算 nn 字 节 RS 码 字 : 

C(x) =g(x) xi(x) 

其 中 x*) 是 信息 块 。 

尽管 它们 背后 有 令 人 生 旦 的 代数 运算 ,但 RS 纠 错 算 法 很 适合 在 计算 机 硬件 中 实现 。 它 们 
用 在 大 型 计算 机 的 高 性 能 磁盘 驱动 器 以 及 存储 音乐 和 数据 的 光盘 上 。 这 些 实现 将 是 在 第 7 章 中 


本 章 小 结 

我 们 已 经 提出 了 数字 计算 机 中 数据 表示 和 数值 运算 的 要 点 。 你 应 该 掌握 用 于 基本 转换 的 各 种 技术 ， 
并 记 住 较 小 的 十 六 进 制 数 和 二 进 制 数 。 当 学 习 本 书 的 其 余部 分 时 ， 这 些 知识 对 你 是 有 益 的 。 如 果 要 求 你 
在 系统 骨 溃 后 读 取 核心 ( 主 存 ) 转 储 文件 或 在 数据 通信 和 领域 中 从 事 重 要 工作 ,那么 十 六 进 制 编码 知识 将 非 
常 有 用 。 

你 也 已 经 看 到 ， 当 在 迭代 过 程 中 允许 有 小 的 误差 时 ， 浮 点 数 可 能 会 产生 重大 的 错误 。 有 各 种 数值 技 
术 可 用 于 控制 这 些 误差 。 这 些 技术 值得 详细 研究 ,但 超出 了 本 书 的 范围 。 

你 已 经 知道 了 大 多 数 计算 机 使 用 ASCII 或 EBCDIC 来 表示 字符 。 全 部 记 住 这 些 代码 通常 没有 什么 用 
处 , 但 是 如 果 你 在 工作 中 会 经 常用 到 它们 ， 那么 你 会 发 现 自己 学 到 了 一 些 “ 关 键 值 ”" ， 从 中 可 以 计算 出 
你 所 需要 的 其 余 大 部 分 值 。 

Unicode 是 Java 和 近期 版 本 的 Windows 使 用 的 默认 字符 集 。 它 可 能 会 作为 计算 机 系统 中 字符 表示 的 基 
本 方法 取代 EBCDIC 和 ASCI; 然而 ,由 于 经 济 性 和 普遍 性 的 原因 ， 这 些 老 的 代码 在 一 段 时 间 内 仍 将 会 
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使 用 。 

错误 检测 和 纠正 代码 几乎 用 于 计算 技术 的 所 有 方面 。 如 果 有 这 种 需要 ， 那么 对 各 种 错误 控制 方法 的 
理解 将 帮助 你 在 可 用 的 各 种 方法 中 做 出 明智 的 选择 。 你 所 选择 的 方法 将 取决 于 许多 因素 ,包括 计算 开销 、 
存储 容量 和 所 用 的 传输 介质 。 


扩展 阅读 

对 西方 文明 中 早期 数学 的 简要 介绍 可 以 在 Bunt 等 人 (1988 ) 的 书 中 找到 。 

Kriuth( 1998 ) 在 他 的 计算 机 算法 系列 的 第 2 卷 中 对 数字 系统 和 计算 机 算术 的 演变 进行 了 一 个 愉快 和 彻 
底 的 讨论 。( 每 个 计算 机 科学 家 都 应 该 拥有 一 套 Knuth 著作 的 书籍 。) 

在 Coldberg(1991 ) 的 著作 找到 浮 点 算术 的 一 个 明确 描述 。Schwartz 等 (1999 ) 描 述 了 IBM System/390 
如 何在 旧版 本 和 正 FE 标准 中 执行 浮 点 运算 。Soderquist 和 Leeser( 1996 ) 对 浮 点 除法 和 平方 根 问 题 进行 了 详 
细 的 讨论 。 

关于 Unicode 的 详细 信息 可 以 在 Unicode 联盟 网 站 www. unicode. org 以 及 Unicode 标准 4. 0 版 (2003 ) 中 
找到 。 

国际 标准 化 组 织 的 网 站 可 以 在 www. iso. ch 找到 。 你 会 惊讶 于 这 个 群体 的 影响 力 。 类 似 的 一 些 信息 可 
以 在 美国 国家 标准 学 会 网 站 上 找到 : www. ansi. org。 

在 掌握 了 布尔 代数 和 数字 逻辑 的 概念 之 后 ， 你 会 喜欢 读 Arazi(1988 ) 的 书 。 这 本 写 得 很 好 的 书展 示 了 
如 何 使 用 简单 的 数字 电路 实现 错误 检测 和 校正 。Arazi 的 附录 对 里 德 -= 所罗门 码 中 使 用 的 伽 罗 华 域 算法 进 
行 了 非常 清晰 的 讨论 。 

如 果 你 希望 对 误差 校正 理论 进行 严格 和 详尽 的 研究 ，Pretzel( 1992 ) 的 书 是 一 本 很 好 的 入 门 书籍 。 这 
本 书 可 访问 、 写 得 很 好 并 且 很 全 面 。 

伽 罗 华 域 的 详细 讨论 可 以 在 Artin(1998 ) 和 Warner(1990 ) 的 著作 中 找到 (不 贵 !) 。Warner 的 厚 书 清晰 
地 全 面 地 介绍 了 抽象 代数 的 概念 。 对 抽象 代数 的 研究 将 有 助 于 你 深入 研究 数学 密码 学 ， 这 是 一 个 在 计算 
机 科学 中 快速 增长 的 兴趣 领域 。 
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复习 题 
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.bit 这 个 单词 是 哪 两 个 词 的 缩写 ? 

. 解释 术语 位 、 字 节 、 半 字 节 和 字 的 关系 。 

. 为 什么 二 进 制 和 十 进 制 称 为 位 置 编号 系统 (positional numbering systems ) ? 

. 说 明基 数 2、 基 数 8 和 基数 16 的 关系 。 

. 什么 是 基数 ? 

. 你 能 回忆 起 表 2-1 中 有 多 少 个 “记得 住 的 数 ”( 在 所 有 基 上 )? 

. 在 无 符号 数 中 溢出 是 什么 意思 ? 

. 说 出 在 数字 计算 机 中 可 以 表示 有 符号 整数 的 4 种 方式 ， 并 解释 它们 之 间 的 区 别 。 
. 对 于 有 符号 整数 的 4 个 表示 中 哪 一 个 在 数字 计算 机 系统 中 最 常用 ? 

. 补 码 系统 在 哪些 方面 与 自行 车 上 的 里 程 表 相似 ? 

. 你 认为 本 章 介绍 的 倍 和 法 是 比 其 他 二 进 制 到 十 进 制 转换 更 容易 的 方法 吗 ? 为 什么 ? 
. 参考 上 一 个 问题 ， 其 他 两 种 转换 方法 的 缺点 是 什么 ? 

. 什么 是 溢出 ， 如 何 检测 ? 无 符号 数字 中 的 溢出 与 有 符号 数字 中 的 溢出 有 何 区 别 ? 
. 如 果 计 算 机 只 能 操作 和 存储 整数 ， 那 么 会 遇 到 什么 困难 ? 这 些 困 难 如 何 克 服 ? 
. 布 斯 算法 的 目标 是 什么 ? 

. 进位 与 洲 出 有 何 区 别 ? 

.什么 是 算术 移 位 ? 

. 浮 点 数 的 3 个 组 成 部 分 是 什么 ? 

. 什么 是 移 码 指数 ? 它 提供 的 功效 是 什么 ? 

. 什么 是 规格 化 ?为 什么 规格 化 是 必要 的 ? 

. 当 使 用 二 进 制 数字 计算 机 执行 浮 点 算术 时 ， 为 什么 总 是 会 有 一 定 程 度 的 误差 ? 
.在 IEEE-754 浮 点 数 标准 下 双 精 度数 字 有 多 少 位 ? 

. 什么 是 EBCDIC， 它 与 BCD 有 什么 关系 ? 

. 什么 是 ASCII， 它 是 如 何 起 源 的 ? 

。 说 明 ASCI 和 Unicode 之 间 的 区 别 。 

。 Unicode 字符 需要 多 少 位 ? 

. 为 什么 要 创建 Unicode? 

.循环 元 余 校 验 如 何 工 作 ? 

. 什么 是 系统 错误 检测 ? 

. 什么 是 汉 明 码 ? 

. 汉 明 距离 是 什么 意思 ， 为 什么 它 这 么 重要 ? 最 小 汉 明 距离 是 什么 意思 ? 

.对 于 与 数据 位 数 相 关 的 编码 ， 所 需 的 元 余 位 数 是 多 少 ? 

. 什么 是 突 发 错误 ? 

。 说 出 一 个 可 以 弥补 罕 发 错误 的 错误 检测 方法 。 
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1. 
9 
4 

2. 


使 用 减法 或 除法 求 余 执行 以 下 基数 转换 : 
a) 45810 = 4 4 b) 677,, = 
6) 1518;0 = 4 d) 4401o = 9 
使 用 减法 或 除法 求 余 执 行 以 下 基数 转换 ; 
aj S88 0 3 b) 2254, = . 
c) 652 ,= d) 3104, = 9 


. 使 用 减法 或 除法 求 余 执行 以 下 基数 转换 ， 
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e) 38710 = 
4. 执行 以 下 基数 转换 : 

0 

c) 1605, = 
5. 执行 以 下 基数 转换 : 

a) 20012; = 信 

cy 3236, = 
6. 执行 以 下 基数 转换 : 

a) 21200, = , 

¢) 3402, = . 


b) 248 ,= 
d) 633 = 


B2302 三 
d) 687, = 10 


b) 4103; = 
d) 1378, = 


b) 3244; = 
d) 7657, = ij 


7. 将 下 列 十 进 制 小 数 转 换 为 二 进 制 ， 二进制 小 数 点 的 右边 最 多 留 6 个 位 置 : 


a) 26. 78125 
c) 298. 796875 


全 


ba 


* b) 194. 03125 
4 d) 16. 1240234375 


8. 将 下 列 十 进 制 小 数 转换 为 二 进 制 ， 二 进 制 小 数 点 的 右边 最 多 留 6 个 位 置 : 


a) 25. 84375 
c) 80. 90625 


SI 
d) 84. 874023 


9. 将 下 列 十 进 制 小 数 转换 为 二 进 制 ， 二 进 制 小 数 点 的 右边 最 多 留 6 个 位 置 : 


a) 27. 59375 

c) 241. 53125 
10. 转换 以 下 二 进 制 小 数 为 十 进 制 : 

a) 10111. 1101 

c) 1010011. 10001 
11. 转换 以 下 二 进 制 小 数 为 十 进 制 : 

a) 100001. 111 

c) 1001100. 1011 
12. 转换 以 下 二 进 制 小 数 为 十 进 制 : 

a) 110001. 10101 

c) 1001001. 10101 
13. 转换 十 六 进 制 数 AC1216 为 二 进 制 数 。 
14. 转换 十 六 进 制 数 7A01,e 为 二 进 制 数 。 
15. 转换 十 六 进 制 数 DEAD BEEF,e 为 二 进 制 数 。 


b) 105. 59375 
d) 327.78125 


b) 100011. 10011 
d) 11000010. 111 


b) 111111. 10011 
d) 10001001. 0111 


b) 111001. 001011 
d) 11101001. 110001 
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16. 使 用 8 位 原 码 、1 的 补 码 (或 反 码 ) 、2 的 补 码 (或 补 码 ) 、 偏 移 值 为 127 的 移 码 表示 以 下 十 进 制 数 。 


命 


a) 77 * BY =42 


ce) 119 di 107 


17. 使 用 8 位 原 码 、1 的 补 码 (或 反 码 )、2 的 补 码 (或 补 码 ) 、 偏 移 值 为 127 的 移 码 表示 以 下 十 进 制 数 。 


a) 60 b) -60 


cu 20 d) -20 


18. 使 用 8 位 原 码 、1 的 补 码 (或 反 码 ) 、2 的 补 码 (或 补 码 ) 、 偏 移 值 为 127 的 移 码 表示 以 下 十 进 制 数 。 


a) 97 b) -97 


c) 44 dy = 


19. 使 用 8 位 原 码 、1 的 补 码 ( 或 反 码 )、2 的 补 码 (或 补 码 ) 、 偏 移 值 为 127 的 移 码 表示 以 下 十 进 制 数 。 


a) 89 b) -89 





c) 66 d) -66 


20. 在 以 下 情况 下 ，8 位 二 进 制 数 10011110 的 十 进 制 值 是 多 少 : 


a) 它 可 解释 为 无 符号 数字 ? 
b) 它 存 储 在 使 用 原 码 表示 的 计算 机 上 ? 


c) 它 存 储 在 使 用 1 的 补 码 (或 反 码 ) 表 示 的 计算 机 上 ? 
d) 它 存 储 在 使 用 2 的 补 码 (或 补 码 ) 表 示 的 计算 机 上 ? 
e) 它 存 储 在 使 用 偏 移 值 为 127 的 移 码 表示 的 计算 机 上 ? 
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21. 


22. 


26. 


27. 


28. 


在 以 下 情况 下 ，8 位 二 进 制 数 00010001 的 十 进 制 值 是 多 少 : 
a) 它 可 解释 为 无 符号 数字 ? 

b) 它 存储 在 使 用 原 码 表示 的 计算 机 上 ? 

c) 它 存 储 在 使 用 1 的 补 码 (或 反 码 ) 表 示 的 计算 机 上 ? 

d) 它 存储 在 使 用 2 的 补 码 (或 补 码 ) 表 示 的 计算 机 上 ? 

e) 它 存储 在 使 用 偏 移 值 为 127 的 移 码 表示 的 计算 机 上 ? 
在 以 下 情况 下 ，8 位 二 进 制 数 10110100 的 十 进 制 值 是 什么 ? 
a) 它 可 解释 为 无 符号 数字 ? 

b) 它 存储 在 使 用 原 码 表 示 的 计算 机 上 ? 

c) 它 存储 在 使 用 1 的 补 码 (或 反 码 ) 表 示 的 计算 机 上 ? 

d) 它 存储 在 使 用 2 的 补 码 (或 补 码 ) 表 示 的 计算 机 上 ? 

e) 它 存储 在 使 用 偏 移 值 为 127 的 移 码 表示 的 计算 机 上 ? 


. 给 定 以 下 两 个 二 进 制 数 : 11111100 和 01110000。 


a) 若 这 两 个 数字 均 为 无 符号 二 进 制 数 ， 那 么 哪 一 个 较 大 ? 
b) 当 在 计算 机 上 使 用 有 符号 2 的 补 码 (或 补 码 ) 表 示 时 ， 这 两 者 中 的 哪 一 个 较 大 ? 
c) 当 在 计算 机 上 使 用 原 码 表示 时 ， 这 两 者 中 的 哪 一 个 较 小 ? 


. 使 用 3 位 “ 字 ”， 列 出 所 有 可 能 的 有 符号 二 进 制 数 及 其 等 价 的 十 进 制 数 : 


a) 原 码 b) 1 的 补 码 ( 或 反 码 ) c) 2 的 补 码 ( 或 补 码 ) 


. 使 用 4 位 “ 字 ”， 列 出 所 有 可 能 的 有 符号 二 进 制 数 及 其 等 价 的 十 进 制 数 : 


a) 原 码 b) 1 的 补 码 ( 或 反 码 ) c) 2 的 补 码 (或 补 码 ) 


从 前 两 个 问题 的 结果 中 ， 归 纳 出 可 以 表示 的 值 的 范围 (十 进 制 ) ， 在 任何 给 定 * 位 数 下 使 用 如 下 编码 : 
b) 1 的 补 码 (或 反 码 ) 


c) 2 的 补 码 (或 补 码 ) 
制 模式 。 


a) 原 码 
填写 下 表 ， 








E 












































1101 








1110 





1111 














假设 有 一 个 (非常 ) 微 小 的 计算 机 ， 其 字 长 为 6 位。 在 以 下 表示 中 ， 这 个 计算 机 可 以 表示 的 最 小 负数 
和 最 大 正 数 是 多 少 ? 
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。a) 1 的 补 码 ( 或 反 码 ) b) 2 的 补 码 (或 补 码 ) 

29. 要 将 两 个 以 2 的 补 码 表示 的 数 相 加 ， 什 么 一 定 是 真 的 ? 

30. 在 大 多 数 计算 机 中 存储 有 符号 整数 最 常用 的 表示 法 是 什么 ， 为 什么 ? 

31. 你 在 环 游 世界 时 偶然 发 现 了 一 种 未 知 的 文明 。 那 些 称 自 己 为 斑马 人 的 人 们 做 数学 使 用 40 个 独立 的 字 
符 (可 能 是 因为 斑马 身上 有 40 条 条 纹 ) 。 他 们 非常 喜欢 使 用 计算 机 ， 所 以 需要 一 台 能 做 斑马 人 数学 的 
计算 机 ， 这 意味 着 一 台 计算 机 要 表示 所 有 的 40 个 字符 。 你 是 一 个 计算 机 设计 师 并 决定 帮助 他 们 。 你 
决定 最 好 是 使 用 二 进 制 编码 斑马 语 BCZ，( 这 很 像 BCD ， 但 它 编码 斑马 语 而 不 是 十 进 制 数 ) 。 如 果 要 
使 用 最 小 的 位 数 ， 你 需要 多 少 位 表示 一 个 字符 ? 

4 32. 对 以 下 无 符号 二 进 制 数 执行 加 法 。 








a) 01110101 b) 00010101 ey) O01101111 
+00111011 十 00011011 +00010001 
33. 对 以 下 无 符号 二 进 制 数 执行 加 法 。 
a) 01000100 b) 01011011 c) 10101100 
+10111011 +00011111 +00100100 
34. 使 用 2 的 补 码 ( 或 补 码 ) 算 术 执 行 以 下 有 符号 二 进 制 数 的 减法 : 
a) 01110101 b) 00110101 cj 0l10I111 
-00111011 —00001011 — 00010001 
35. 使 用 2 的 补 码 ( 或 补 码 ) 算 术 执 行 以 下 有 符号 二 进 制 数 的 减法 : 
a) 11000100 b) 01011011 c) 10101100 
—00111011 -00011111 —00100100 
36. 假设 以 下 数 为 无 符号 整数 ， 执 行 二 进 制 乘法 : 
4a) 1100 b) 10101 c) 11010 
x*101l 2 由 | x1100 
37. 假设 以 下 数 为 无 符号 整数 ， 执 行 二 进 制 乘法 : 
4a) 1011 b) 10011 c) 11010 
x101 x1011 x1011 
38. 假设 以 下 数 为 无 符号 整数 ， 执 行 二 进 制 除法 : 
* a) 101101 :101 b) 10000001 = 101 c) 1001010010 = 1011 
39. 假设 以 下 数 为 无 符号 整数 ， 执 行 二 进 制 除法 : 
a) 11111101 :1011 b) 110010101 = 1001 c) 1001111100 :1100 


40. 使 用 倍增 法 转换 10212; 为 十 进 制 数 ( 提示 : 你 必须 改变 乘 数 。) 
。41. 使 用 原 码 表示 ， 完 成 以 下 操作 : 

+0+(-0) = 
(-0) +0 = 
0 +0 = 

(=0) $ (= = 

4 42. 假设 一 台 计 算 机 使 用 4 位 1 的 补 码 (或 反 码 ) 表 示 ， 忽 略 溢出 ， 在 下 面 的 伪 代 码 程序 终止 后 ， 什 么 样 

的 值 将 存储 在 变量 j 中 ? 


0 一 jj /7 Store 0 in 寺 ， 


-3— k // Store -3 in Kk. 


while k * 0 
bs 
R= k= 1 


end while 


43. 假设 以 下 整数 为 有 符号 2 的 补 码 (或 补 码 ) ， 使 用 布 斯 算法 执行 二 进 制 乘法 。 








4a) 1011 b) 0011 c) 1011 
x1011 x1011 x 1100 
44. 使 用 算术 移 位 ， 执 行 以 下 操作 : 


45. 


4 46. 


47. 


S1. 


S2. 


53。 


SS5. 


56. 


a) 00010101, 的 两 倍 b) 01110111. 的 四 倍 c) 11001010, 的 一 半 

如 果 某 个 系统 上 的 浮 点 数 表 示 有 1 位 符号 位 、3 位 指数 和 4 位 有 效 位 数 : 

a) 如 果 这 个 系统 的 存储 已 被 规格 化 ,那么 它 可 以 存储 的 最 大 正 数 和 最 小 正 数 是 多 少 ? (假设 没有 隐 含 
位 、 没 有 移 码 、 指 数 使 用 2 的 补 码 (或 补 码 ) 表 示 法 并 且 全 0 和 全 1 指数 都 是 允许 的 。) 

b) 如 果 我 们 更 喜欢 所 有 指数 都 为 非 负数 ， 则 应 该 在 指数 中 使 用 什么 移 码 ? 你 为 什么 选择 这 种 移 码 ? 

使 用 上 一 个 问题 中 的 模型 (包括 选择 的 移 码 ) ， 并 使 用 与 加 数 和 被 加 数 同样 的 表示 方法 ， 对 以 下 浮 点 

数 做 加 法 运算 : 
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计算 上 一 个 问题 答案 中 的 相对 误差 (如 果 有 的 话 ) 。 

假设 我 们 正在 使 用 本 书 给 出 的 以 浮 点 表示 的 简单 模型 (该 表示 使 用 14 位 格式 ， 使 用 偏 移 值 为 15 的 5 

位 指数 、8 位 的 标准 化 尾数 和 数字 的 单 符号 位 ) : 

a) 显示 计算 机 如 何 用 这 种 浮 点 格式 表示 数字 100.0 和 0. 25。 

b) 计算 机 在 通过 改变 一 个 数字 的 a 部 分 使 它们 都 以 相同 的 2 的 老 来 表示 的 情况 下 ， 执 行 a 部 分 中 的 
两 个 浮 点 数 相 加 。 

c) 显示 计算 机 如 何 使 用 给 定 的 浮 点 表示 法 表示 “部 分 的 总 和 。 计 算 机 实际 存储 的 十 进 制 值 的 和 是 多 
少 ? 请 解释 。 


. 什么 会 导致 下 溢 ， 对 此 可 以 做 些 什么 呢 ? 
49. 
50. 


为 什么 我 们 通常 以 规格 化 形式 存储 浮 点 数 ? 使 用 移 码 而 不 是 向 指数 添加 符号 位 的 优点 是 什么 ? 
设 a=1.0x2”、b= -1.0x2 "和 c=1.0x2'。 使 用 本 书 中 描述 的 简单 浮 点 数 模型 (该 表示 使 用 14 位 格 
式 ， 偏 移 值 为 15 的 5 位 指数 、 标 准 化 尾数 为 8 位 和 数字 的 单 符号 位 ) ， 进 行 以 下 计算 ， 请 密切 关注 操 
作 顺 序 。 关 于 有 限 模型 中 浮 点 运算 的 代数 性 质 ， 你 能 说 些 什么 ?你 认为 这 个 代数 异常 在 乘法 和 加 法 
下 都 成 立 吗 ? 

+(a+c) = 

(b+a) +c= 
使 用 正 EE-754 单 精度 表示 如 何 存 储 以 下 每 个 浮 点 数 ( 一 定 要 指示 符号 位 、 指 数 和 有 效 数 域 ) : 
a) 12.5 b) -1.5 c) 0. 75 d) 26. 625 
使 用 IEEE-754 双 精 度 表 示 如 何 存储 以 下 每 个 浮 点 数 (一 定 要 指示 符号 位 ， 指 数 和 有 效 数 域 ) : 
a 12.3 b) -1.5 c) 0.75 d) 26. 625 
假设 我 们 找到 了 另 一 个 浮 点 数 表示 法 。 使 用 这 个 表示 ， 一 个 12 位 浮 点 数 有 1 位 表示 符号 、4 位 为 指 
数 、7 位 为 尾数 。 和 这 个 简单 模型 一 样 进行 规范 化 ， 使 小 数 点 右边 的 第 一 个 数字 必须 是 1。 指 数 中 的 
数字 是 有 符号 2 的 补 码 (或 补 码 ) 表 示 。 不 使 用 移 码 ， 并 且 没有 隐 含 位 。 显示 使 用 以 下 格式 中 以 表示 
的 最 小 正 数 ( 只 需 填写 在 提供 的 方 格 中 ) 。 它 的 十 进 制 数 是 多 少 ? 


. 找到 3 个 浮 点 值 来 说 明 浮 点 数 加 法 不 满足 结合 律 (你 需要 在 有 特定 编译 器 的 特定 硬件 上 运行 一 个 


程序 。) 

a) 假设 字符 A 的 ASCII 码 是 1000001， 那么 字符 丁 的 ASCII 码 是 什么 ? 

b) 假设 字符 A 的 EBCDIC 码 是 1100 0001， 那么 字符 丁 的 EBCDIC 码 是 什么 ? 

a) 字母 A 的 ASCII 码 是 1000001， 字 母 a 的 ASCII 码 是 1100001。 给 定 字母 G 的 ASCII 码 是 1000111 ， 
不 看 表 2-7， 字 母 g 的 ASCII 码 是 什么 ? 
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62. 
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65. 


67. 


b) 字母 A 的 EBCDIC 码 是 1100 0001， 字 母 a 的 EBCDIC 码 是 1000 0001。 给 定 G 的 EBCDIC 码 是 1100 
0111, 不 看 表 2-6， 字母 g 的 EBCDIC 码 是 什么 ? 

c) 字母 A 的 ASCII 码 是 1000001， 字 母 a 的 ASCII 码 是 1100001。 给 定 Q 的 ASCII 码 是 1010001， 不 看 
表 2-7,， 字母 q 的 ASCII 码 是 什么 ? 

d) 字母 J 的 EBICIC 码 是 1101 0001， 字 母 j 的 EBCDIC 码 是 1001 0001。 给 定 Q 的 EBCDIC 码 是 1101 
1000 ,不 看 表 2-6， 字 和 母 q 的 EBCDIC 码 是 什么 ? 

el 一 般 来 说 ， 如 果 要 编写 一 个 程序 将 大 写 ASCII 字符 转换 为 小 写字 符 ， 你 会 怎么 做 ?观察 表 2-6， 你 
| 可 以 使 用 相同 的 算法 将 大 写 EBCDIC 字母 转换 为 小 写 吗 ? 

f) 如 果 你 的 任务 是 将 使 用 ASCII 或 Unicode 的 计算 机 与 基于 EBCDIC 的 计算 机 进行 接口 ， 转 换 EBC- 
DIC 字符 到 ASCII 字符 的 最 好 的 方式 是 什么 ? 

假设 计算 机 上 有 24 位 字 。 在 这 24 位 中 ,我 们 希望 表示 值 295 。 

a) 计算 机 如 何 表示 十 进 制 值 295? 

b) 如 果 我 们 的 计算 机 使 用 8 位 ASCII 和 偶 校 验 ， 那 么 计算 机 如 何 表示 字符 串 295? 

c) 如 果 我 们 的 计算 机 使 用 带 有 零 填 充 的 压缩 BCD， 计 算 机 如 何 表示 数字 +295? 

解码 以 下 ASCII 消息 ,假设 有 7 位 ASCI 字符 ， 无 奇偶 校 验 位 : 

1001010 1001111 1001000 1001110 0100000 1000100 1001111 1000101 
为 什么 系统 设计 师 希 望 将 Unicode 作为 新 系统 的 默认 字符 集 ? 你 能 给 出 不 使 用 Unicode 作为 默认 值 的 
理由 吗 ? (提示 : 考虑 语言 兼容 性 与 存储 空间 。) 


. 假设 我 们 希望 创建 一 个 使 用 3 位 信息 位 、1 位 奇偶 校 验 位 (附加 到 信息 的 末尾 ) 并 使 用 奇 校 验 的 编码 。 


列 出 此 编码 中 所 有 合法 的 码 字 。 编 码 的 汉 明 距离 是 多 少 ? 


. 假设 我 们 给 出 下 面 的 码 字 子 集 ， 创建 带 有 一 个 奇偶 校 验 位 的 7 位 存储 器 字 : 11100110、00001000、 


10101011 和 11111110。 这 个 代码 使 用 的 是 偶 校 验 还 是 奇 校 验 ? 请 解释 原因 。 

纠 错 汉 明 码 是 否 是 系统 错误 检测 码 ? 请 解释 原因 。 

计算 以 下 代码 的 汉 明 距离 : 
0011010010111100 
0000011110001111 
0010010110101101 
0001011010011110 


. 计算 以 下 代码 的 汉 明 距离 : 


0000000101111111 

0000001010111111 

0000010011011111 

0000100011101111 

0001000011110111 

0010000011111011 

0100000011111101 

1000000011111110 
在 为 一 个 编码 定义 汉 明 距离 时 ,我们 选择 使 用 任何 两 个 编码 之 间 的 最 小 ( 汉 明 ) 距 离 。 解 释 为 什么 使 
用 最 大 或 平均 距离 不 会 更 好 。 


. 假设 我 们 想 要 有 一 种 纠 错 码 ， 对 于 长 度 为 10 的 存储 器 字 ， 它 允许 纠正 所 有 一 位 错 。 


a) 这 需要 多 少 个 奇偶 校 验 位 ? 

b) 假设 我 们 使 用 本 章 介 绍 的 汉 明 算法 设计 纠 错 码 ， 找 到 码 字 以 表示 这 个 10 位 信息 字 : 
10O0L1IO0TL0 

假设 我 们 想 要 有 一 种 纠 错 码 ， 对 于 长 度 为 12 的 存储 器 字 ， 它 将 允许 纠正 所 有 一 位 错误 。 
a) 这 需要 多 少 个 奇偶 校 验 位 ? 

b) 假设 我 们 使 用 本 章 介绍 的 汉 明 算法 设计 纠 错 码 ， 找 到 码 字 以 表示 这 个 12 位 信息 字 : 
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4 68. 假设 我 们 正在 使 用 一 种 纠 错 码 ， 对 长 度 为 7 的 存储 器 字 ， 它 允许 纠正 所 有 一 位 错 。 我 们 已 经 计算 出 


需要 4 个 校 验 位 ， 所 有 码 字 的 长 度 都 为 11。 码 字 根 据 本 书 提供 的 汉 明 算法 创建 。 我 们 现在 收 到 了 以 
下 码 字 : 10 101011110, 假设 使 用 偶 校 验 ， 这 是 一 个 合法 的 码 字 吗 ? 如 果 不 是 ， 根 据 我 们 的 纠 
错 码 ， 错 误 在 哪里 ? 


69. 使 用 以 下 码 字 重复 练习 题 68: 01111010101 


70. 


假设 我 们 正在 使 用 一 个 纠 错 码 ， 对 长 度 为 12 的 存储 器 字 ， 它 允许 纠正 所 有 一 位 错 。 我 们 已 经 计算 出 
需要 5 个 校 验 位 ， 所 有 码 字 的 长 度 为 17。 码 字 根 据 本 书 提供 的 汉 明 算法 创建 。 我 们 现在 收 到 了 以 下 
码 字 : 01100101001001001, 假设 使 用 偶 校 验 ， 这 是 一 个 合法 的 码 字 吗 ? 如 果 不 是， 根据 我 
们 的 纠 错 码 ， 错 误 在 哪里 ? 

.请 列举 两 种 不 同 于 汉 明 编码 的 里 德 -所 风门 码 方式 。 


72. 什么 时 候 你 会 在 一 个 汉 明 码 上 面 选择 一 个 CRC? 什么 时 候 你 会 在 一 个 CRC 上 面 选择 一 个 汉 明 码 ? 
4 73. 求 下 列 模 2 除法 的 商 和 余数 。 


4 a) 1010111, > 1101， » b) 1011111, :11101， 
4 c) 1011001101, + 10101, » d) 111010111, : 10111， 
74. 求 下 列 模 2 除法 的 商 和 余数 。 
a) 1111010, = 1011， b) 1010101, = 1100， 
c) 1101101011, + 10101， d) 1111101011, + 101101， 
75. 求 下 列 模 2 除法 的 商 和 余数 。 
a) 11001001, :1101， b) 1011000, = 10011， 
ce) 11101011, : 10111， d) 111110001, > 1001， 
76. 求 下 列 模 2 除法 问题 的 商 和 余数 。 
a) 1001111, :1101， b) 1011110, + 1100， 
c) 1001101110, + 11001， d) 111101010, = 10011, 
4 77. 使 用 CRC 多 项 式 1011， 计 算 信息 字 1011001 的 CRC 码 字 。 检 查 在 接收 方 执行 的 除法 。 


78. 使 用 CRC 多 项 式 1101， 计 算 信息 字 01001101 的 CRC 码 字 。 检 查 接 收 方 执行 的 除法 。 
79. 使 用 CRC 多 项 式 1101， 计 算 信息 字 1100011 的 CRC 码 字 。 检 查 接 收 方 执行 的 除法 。 
80. 使 用 CRC 多 项 式 1101， 计 算 信息 字 01011101 的 CRC 码 字 。 检 查 在 接收 方 执行 的 除法 。 


.选择 一 个 架构 (如 80486 、Pentium 、Pentium IV、SPARC、Alpha 或 MIPS) 。 研 究 该 架构 如 何 处 理 本 章 
所 介绍 的 概念 。 例 如 ， 它 用 什么 表示 负 值 ? 它 支 持 什么 字符 编码 ? 
. 我 们 已 经 看 到 ， 浮 点 算术 既 不 满足 结合 律 也 不 满足 分 配 律 。 你 认为 为 什么 是 这 样 的 ? 


特别 关注 : 数据 记录 和 传输 的 编码 


ASCII[、EBCDIC 和 Unicode 在 计算 机 存储 器 中 已 被 明确 表示 。( 第 3 章 介绍 如 何 使 用 二 
ple ge ed ihe ss nh ge dy nee 
者 “ 开 ”。 然 而 ， 当 数据 被 写 入 某 种 记录 介质 ( 如 磁带 或 磁盘 ) 或 长 距离 传输 时 ， 二 进 制 信 
号 可 能 变 得 模糊 ， 特 别 是 当 涉及 一 长 串 的 1 和 ;0 时 。 这 种 模糊 部 分 归 因 于 发 送 方 和 接收 方 
之 间 的 时 间 漂 移 。 磁 介质 如 磁带 和 磁盘 ， 也 可 能 因为 磁性 材料 具有 的 电气 性 能 而 失去 同 
步 。 数 字 信 号 的 “高 ”和 “ 低 ” 状 态 之 间 的 信号 转换 有 助 于 在 数据 记录 和 通信 设备 中 保持 
同步 。 为 此 ，ASCII、EBCDIC 和 Unicode 在 传输 或 记录 之 前 被 转换 成 其 他 编码 。 这 个 转换 
是 由 数据 记录 和 传输 设备 中 的 控制 电子 设备 操作 的 。 用 户 和 主机 都 不 知道 这 种 转换 已 经 
发 生 。 
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电信 设备 通过 在 传输 介质 (例如 ， 铜 线 ) 中 使 用 “高 ”和 “ 低 ” 脉 冲 来 发 送 和 接收 字 
节 。 磁 性 存储 设备 使 用 名 为 磁 通 反 转 的 磁极 变化 来 记录 数据 。 某 些 编码 方法 更 适合 数据 通 
信 而 不 是 数据 记录 。 新 的 编码 不 断 被 发 明 ， 以 适应 不 断 变化 的 记录 方法 和 改进 的 传输 和 记 
录 介质 。 我 们 将 研究 一 些 较 流行 的 记录 和 传输 编码 ， 以 显示 如 何 克 服 这 一 领域 的 一 些 挑 
战 。 为 了 简洁 起 见 ， 我 们 将 使 用 术语 数据 编码 来 表示 将 简单 字符 代码 ( 如 ASCIT) 转换 成 更 
适合 存储 或 传输 的 其 他 代码 的 过 程 。 编 码 数据 表示 被 编码 的 字符 代码 。 


2Aji1 非 归 零 码 

有 最 简单 的 数据 编码 方法 是 非 归 零 ( NRZ) 码 。 我 们 使 用 这 种 编码 意味 着 当 我 们 说 “高 ” 
和 “ 低 ” 时 分 别 代表 1 和 0:; 通常 1 为 高 电压 ,0 为 低 电 压 。 通 常 ， 高 电压 为 +3V 或 +5V; 
低 电 压 为 -3V 或 -5V。( 相反 的 情况 在 逆 辑 上 是 等 效 的 。) 

例如 ， 具 有 偶 校 验 的 英文 单词 OK 的 ASCII 编码 是 11001111 01001011。 在 NRZ 码 中 ， 
这 种 模式 以 信号 形式 和 磁 通 形式 在 图 2A-1 中 显示 。 每 位 占据 传输 介质 中 一 个 任意 时 间 片 ， 
或 磁盘 上 一 个 任意 空间 点 。 这 些 片 和 点 称 为 位 元 。 


人 人 个人 人 本 和 人 个人 人 人 个 个 个 个 个 村 个人 个 人 人 人 个 


b ) 磁 通 量 模式 ( 箭头 方向 表示 磁极 ) 
图 2A-1 OK 的 NRZ 编码 


正如 图 2A-1 所 示 ,， 在 ASCII 字符 0 中 有 连续 的 1。 如 果 传 送 单词 OK 的 更 长 形式 
OKAY， 那 么 我 们 会 有 一 长 串 0， 以 及 一 长 串 1 的 字符 串 : 11001111 01001011 01000001 
01011001。 除 非 接收 方 与 发 送 方 精确 同步 ， 否 则 无 法 知道 每 个 位 元 信号 确切 的 持续 时 间 。 
接收 方 的 慢 定 时 或 异 相 定 时 可 能 导致 单词 OKAY 的 位 序列 被 接收 为 : 10011 0100101 010001 
0101001。 这 个 位 序列 转换 回 ASCI 码 是 <ETX > ()， 这 与 发 送 的 内 容 不 相同 。( < ETX > 
用 于 表示 一 个 ASCII 的 文本 结束 字符 ,十进制 表示 为 26)。 

这 个 例子 的 小 实验 表明 ;在 NRZ 代码 中 只 要 丢 了 一 位 ， 整 个 消息 就 可 能 成 为 乱码 。 


2A.2 不 归 零 反 转 码 

不 归 零 反 转 ( NRZI) 方 法 解决 了 同步 丢失 的 部 分 问题 。NRZI 中 的 每 个 二 进 制 1 都 有 从 
高 到 低 或 低 到 高 的 转换 ， 二 进 制 0 没有 转换 。 对 于 单词 OK 的 NRZI 编码 (具有 偶 校 验 ) 如 图 
2A-2 所 示 。 

虽然 NRZI 消除 了 二 进 制 1 丢失 的 问题 ,但 我 们 仍然 面临 着 长 串 0 的 问题 ， 这 会 导致 接 
收 方 或 读 设 备 偏离 相位 ， 这 种 方法 有 可 能 丢掉 二 进 制 位 。 

解决 这 个 问题 的 明显 方法 是 向 传输 波形 注入 足够 的 转换 ， 以 保持 发 送 方 和 接收 方 的 同 
步 ， 同 时 保持 消息 的 信息 内 容 。 这 是 今天 在 数据 存储 和 传输 中 使 用 的 所 有 编码 方法 背后 的 
基本 思想 。 
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图 2A-2 单词 


2A.3 调 相 (曼彻斯特 码 ) 

通常 称 为 调 相 ( PM) 或 曼彻斯特 码 的 编码 方法 正 是 解决 同步 问题 的 方法 。PM 中 每 个 位 
都 有 一 次 转换 ， 无 论 是 1 还 是 0。 在 PM 中 ， 每 个 二 进 制 1 用 一 个 “向 上 ”的 转换 表示 ， 二 
进 制 0 用 一 个 “向 下 ”的 转换 表示 。 必 要 时 ， 在 位 元 边界 上 提供 额外 的 转换 。OK 这 个 词 
的 PM 编码 如 图 2A-3 所 示 。 
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b ) 磁 通 量 模式 
图 2A-3 单词 OK 的 调 相 ( 曼彻斯特 编码 ) 


调 相 通常 用 于 数据 传输 应 用 ， 如 局 域 网 。 然 而 ， 它 不 适合 用 在 数据 存储 中 。 如 果 在 磁 
带 和 磁盘 中 使 用 PM， 则 调 相 的 位 密度 将 是 NRZ 的 两 倍 。( 每 半 个 位 元 有 一 次 磁 通 变换 ， 如 
图 2A-3b 所 示 。) 然 而 ， 我 们 刚刚 看 到 使 用 NRZ 可 能 导致 有 无 法 接受 的 高 错误 率 。 因 此 ， 我 
们 可 以 定义 一 种 “好 的 ”编码 方案 ， 即 在 “过 度 ” 存 储 要 求 与 “过 度 ” 错 误 率 之 间 达 到 
平衡 的 最 经 济 的 方法 。 为 了 寻找 这 个 平衡 ， 已 经 创建 了 许多 代码 。 \ 


2A.4 调频 \ 

当 用 于 数字 应 用 时 ， 调 频 ( FM) 与 调 相 相似 ， 其 中 每 个 位 元 至 少 有 一 次 转换 。 这 昔 同 
步 转换 发 生 在 每 个 位 元 的 开头 。 为 了 对 二 进 制 1 进行 编码 ， 在 位 元 的 中 间 应 有 附加 的 转换 。 
单词 OK 的 FM 编码 如 图 2A-4 所 示 。 

从 图 2A-4 中 可 以 看 出 ， 对 于 其 存储 要 求 ，FM 只 比 PM 稍 好 一 点 。 然 而 ， 有 一 种 对 FM 
本 身 改进 的 编码 方法 称 为 改进 调频 (MFM) ， 其 中 位 元 边界 的 转换 只 在 相 邻 0 之 间 才 有 。 那 
么 ,在 MFM 中 每 一 对 位 元 至 少 有 一 次 转换 ， 而 不 是 像 在 PM 或 FM 中 每 个 位 元 至 少 有 一 次 
转换 。 
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| 图 2A-4 单词 OK 的 调频 编码 
MFM 比 PM 的 转换 次 数 少 ， 比 NRZ 的 转换 次 数 多 。MFM 是 一 种 在 经 济 性 和 错误 控制 
方面 高 效 的 编码 。 多 年 来 ，MFM 实际 上 是 硬盘 存储 的 唯一 编码 方法 。 单 词 OK 的 MFM 编 
码 如 图 2A-5 所 示 。 
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2A.5 游程 长 度 受 限 码 

游程 长 度 受 限 ( RLL) 是 一 种 编码 方式 ， 在 这 种 编码 方法 中 诸如 ASCI 或 EBCDIC 之 类 
的 块 字符 码 字 转 换 为 在 限制 代码 中 出 现 连 续 零 数 量 的 码 字 。 一 个 RLL(d, 上 ) 编码 允许 最 小 
d 个 和 最 大 上 个 连续 0 出 现在 任何 一 对 连续 的 1 之 间 。 

显然 ，RLL 码 字 必 须 包 含 比 原 始 字符 代码 更 多 的 位 。 然 而 ， 因 为 RLL 是 使 用 磁盘 上 的 
NRZI 进行 编码 的 ， 所 以 RLL 编码 的 数据 实际 上 占用 较 少 的 磁 介 质 空间 ， 因 为 它 涉及 更 少 
的 磁 通 转换 。 使 用 RLL 码 字 的 目的 是 防止 硬盘 出 现 丢 失 同 步 的 情况 ， 在 使 用 缺少 变化 的 二 
进 制 NRZI 码 时 会 出 现 这 种 情况 。 

虽然 有 许多 变种 ,但 RELL(2，7) 是 磁盘 系统 使 用 的 主要 编码 。 在 技术 上 它 是 8 位 
ASCI 或 EBCDIC 字符 的 16 位 映射 。 然 而 ， 在 磁 通 逆转 方面 ， 它 儿 乎 比 MFM 有 效 50% 。 
(证 明 这 个 结果 留 给 读者 作为 一 个 练习 。) 

理论 上 讲 ，RLL 是 一 种 名 为 赫 夫 曼 编码 ( 在 第 7 章 中 讨论 ) 的 数据 压缩 形式 ， 赫 夫 曼 编码 
使 用 最 短 的 码 字 位 模式 对 最 合适 的 信息 位 模式 进行 编码 。( 在 这 儿 ， 我 们 在 谈论 最 少 的 磁 通 逆 
转 。) 这 个 理论 基于 这 样 一 个 假设 : 在 任何 位 元 中 存在 或 不 存在 1 是 一 个 概率 相等 的 事件 。 从 
这 个 假设 我 们 可 以 推断 模式 10 在 任何 一 对 相 邻 位 元 内 发 生 的 概率 是 0.25。[P(b; =1) =1/2; 
P( =0) =1/2; =P(b,b,=10) =1/2 x1/2=1/4]。 类 似 地 ， 位 模式 011 的 发 生 概 率 为 0.125。 
图 2A-6 显 示 了 在 RLL(2, 7) 中 使 用 位 模式 的 概率 树 。 表 2A-1 给 出 了 RLL(2, 7) 使 用 的 位 模式 。 

正如 表 2A-1 中 所 示 ， 不 可 能 有 超过 7 个 连续 的 0， 至 少 两 个 0 将 出 现在 任何 可 能 的 位 
组 合 中 。 

2A-7 将 单词 OK 的 MFM 编码 与 其 RLL(2,7)NRZI 编码 进行 了 比较 。MFM 有 12 次 
磁 通 转换 ,而 RLL 有 8 次 转换 。 在 磁盘 设计 中 ， 如 果 限 制 因素 是 每 平方 毫米 的 磁 通 转换 次 
数 ， 则 在 相同 的 磁性 区 域 中 单词 OK 使 用 RLL 比 使 用 MFM 可 以 多 压缩 50% 以 上 。 因 此 ， 
RLL 几乎 全 部 用 于 高 容量 磁盘 驱动 器 。 
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图 2A\7 单词 OK 的 MFM 编码 (上 ) 


2A.6 部 分 响应 最 大 似 然 编码 


在 当今 超 高 容量 的 磁盘 和 磁带 介质 上 ，RLL 本 身 不 是 足够 可 靠 的 编码 。 随 着 数据 密度 
的 增加 ， 编 码 位 必须 写 得 更 靠近 一 些 。 这 意味 着 将 有 较 少 的 磁性 材料 颗粒 参与 每 位 的 纺 
码 ， 这 会 导致 磁 信 号 的 强度 降低 。 随 着 信号 强度 的 降低 ， 相 邻 的 磁 通 反 转 开始 互相 干扰 。 
这 种 名 为 于 加 的 现象 是 有 特点 的 ， 如 图 2A-8 所 示 。 它 显 示 了 一 个 漂亮 、 整 洁 、 易 于 检测 的 
磁 正弦 波 ， 看 起 来 像 一 串 束 得 过 熟 得 意大利 面条 。 
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图 2A-8” 随 着 a)、b) 和 c) 中 位 密度 的 增 大 ， 磁 通 变 化 越 来 越 紧 密 
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尽管 它 有 不 好 看 的 外 观 ， 但 登 加 的 波形 可 以 很 好 地 被 定义 和 理解 。 然 而 ， 与 传统 的 正 
琉 波 不 同 ， 它 们 的 特性 不 能 被 简单 的 峰值 检测 器 捕获 ， 它 对 每 个 位 元 执行 一 次 测量 。 相 
反 ， 它 们 在 位 元 波形 中 可 以 多 次 采样 ， 对 检测 器 电路 给 出 一 种 “部 分 响应 ”模式 。 然 后 ， 
检测 器 电路 (维特 比 检测 器 ) 将 部 分 响应 模式 与 相对 较 小 的 一 组 可 能 的 响应 模式 相 匹配 ， 并 
将 最 接近 的 匹配 (“ 最 大 仪 然 ”正确 模式 ) 传 递 给 数字 译 码 器 。 因 此 ， 这 种 编码 方案 称 为 部 
分 响应 最 大 似 然 (PRML) 。( 在 阅读 第 3 章 之 后 ， 您 将 了 解 维特 比 检测 器 如 何 决定 哪 种 模式 
是 最 有 可 能 的 。) 

PRML 是 一 系列 编码 方法 的 通用 名 称 ， 不 同方 法 之 间 是 通过 每 个 位 元 采样 的 数目 来 区 
分 的 。 更 频繁 的 采样 允许 更 大 的 数据 密度 。 随 着 磁头 技术 的 改进 ， 自 2000 年 以 来 ，PRML 
一 直 是 磁盘 和 磁带 密度 增加 的 根本 推动 因素 ， 这 项 技术 确实 有 可 能 尚未 得 到 充分 的 利用 。 
2A:7 总 结 

在 磁盘 和 磁带 上 如 何 存储 字 节 的 理解 将 有 助 于 了 解 许多 与 数据 存储 相关 的 概念 和 问 
题 。 熟悉 错误 控制 方法 将 有 助 干 研究 数据 存储 和 数据 通信 。 有 关 磁 存 储 数据 编码 的 最 佳 信 
息 可 以 在 电气 工程 书籍 中 找到 。 它 们 包含 一 系列 关于 物理 介质 行为 的 引人入胜 的 信息 ， 以 
及 这 种 行为 如 何 被 各 种 编码 方法 所 使 用 。 在 第 7 章 中 将 学 到 更 多 的 有 关 效 据 存 信 的 内 容 。 
第 12 章 介绍 与 数据 通信 有 关 的 主题 。 
练习 

1. 为 什么 避免 使 用 非 归 零 码 作为 数据 写 入 磁盘 的 方法 ? 

2. 为 什么 曼彻斯特 编码 不 是 将 数据 写 入 磁盘 的 好 选择 ? 

3. 解释 游程 长 度 受 限 码 的 工作 原理 。 

4. 使 用 以 下 编码 写 出 字符 4 的 7 位 ASCII 码 

a) 非 归 零 码 

b) 不 归 零 反 转 码 

ce) 曼彻斯特 码 

d) 调频 

e) 改进 调频 

人 游程 长 度 受 限 

(假设 1 为 “高 "，0 为 “ 低 "。) 
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3.1 引言 


19 世纪 上 半 叶 ， 乔治: 布尔 居住 在 英国 。 作 为 皮 匠 的 长 子 , 他 自学 了 希腊 语 、 拉 丁 语 、 
法 语 、 德 语 和 数学 语言 。 就 在 布尔 快 16 岁 时 ， 他 接受 了 在 一 所 小 型 卫 理 公会 学 校 的 教学 工作 ， 
为 他 的 家 庭 提供 急需 的 收入 。 在 19 岁 的 时 候 ， 布 尔 回 到 家 乡 英格兰 的 林肯 ， 创 办 了 自己 的 寄 
宿 学 校 ， 更 好 地 为 自己 的 家 庭 提供 支持 。 他 经 营 这 所 学 校 共 15 年 ， 直 到 他 成 为 爱尔兰 科 克 皇 
后 学 院 的 数学 教授 。 作 为 一 个 商人 的 儿子 ， 布 尔 的 社会 地 位 不 允许 他 到 更 有 名 的 大 学 工作 ， 尽 
管 他 发 表 了 十 几 篇 备 受 推崇 的 论文 和 专著 。 最 著名 的 专著 《思维 规律 》 出 版 于 1854 年 ,创建 了 
被 称 为 符号 逻辑 或 布尔 代数 的 数学 分 支 。 

将 近 85 年 后 ,约翰 文 森 特 : 阿 塔 纳 索 夫 将 布尔 代数 应 用 于 计算 。 他 对 本 书 作者 Linda 
Null 讲述 了 自己 对 计算 机 组 成 与 体系 结构 的 见解 。 在 当时 ， 阿 塔 纳 索 夫 试图 使 用 跟 帕 斯 卡尔 和 
巴 贝 奇 同 样 的 技术 构建 一 台 计 算 机 。 他 的 目的 是 使 用 这 台 计 算 机 求解 线性 系统 方程 。 经 过 努力 
但 多 次 失败 后 ， 阿 塔 纳 索 夫 非 常 诅 形 ， 他 决定 开车 出 去 转 转 。 当 时 他 住 在 艾 奥 瓦 州 的 埃 姆 斯 ， 
当 他 突然 意识 到 已 经 开 出 很 远 的 时 候 ， 发 现 自己 已 经 把 车 开 到 了 200 英里 ( 约 322 公里 ) 外 的 伊 
利 诺 伊 州 。 

阿 塔 纳 索 夫 本 来 不 打算 开车 到 那么 远 的 地 方 ， 但 是 因为 伊利 诺 伊 州 是 一 个 可 以 在 酒馆 合法 
买 酒 的 地 方 ， 他 便 坐 了 下 来 点 了 杯 威士忌 。 当 他 意识 到 驾驶 这 样 远 的 距离 只 为 喝 一 杯 酒 时 ， 他 
笑 了 起 来 ! 更 具有 讽刺 意味 的 是 ， 他 以 前 从 来 不 喝酒 。 他 觉得 自己 需要 一 个 清醒 的 头脑 以 记 下 
在 漫 无 目的 的 旅程 中 所 想到 的 启示 。 根 据 以 往 的 物理 和 数学 背景 以 及 之 前 研制 计算 机 失败 的 教 
训 ， 他 在 计算 机 的 新 设计 上 有 了 4 个 关键 且 必要 的 突破 : 

1. 用 电 代替 机 械 运 动 ( 电 子 管 将 允许 他 这 样 做 ) 。 

2. 因为 用 了 电 ， 所 以 他 将 利用 以 2 为 基 的 数字 而 不 是 10( 这 直接 与 执行 “ 开 ” 或 “ 关 ” 
的 开关 相关 ) ， 这 台 机 器 使 用 数字 量 ， 而 不 是 模拟 量 。 

3. 因为 电容 可 以 存储 电能 ， 所 以 他 为 内 存 使 用 电容 (冷凝 器 ) 作 为 其 再 生 过 程 ， 以 防止 漏电 。 

4. 计算 由 被 阿 塔 纳 索 夫 称 为 “直接 的 逻辑 行动 ”来 完成 (其 实质 上 等 同 于 布尔 代数 ) ， 而 
不 是 像 以 前 所 有 的 计算 设备 那样 通过 枚 举 来 执行 计算 。 

应 当 指出 ， 在 当时 阿 塔 纳 索 夫 没有 意识 到 可 将 布尔 代数 应 用 到 他 的 问题 中 ， 他 通过 试验 和 
以 前 发 现 的 错误 制定 了 自己 的 逻辑 操作 。 他 不 知道 在 1938 年 香农 证 明了 二 值 布 尔 代 数 可 以 描 
述 二 值 开关 电路 。 今 天 ， 布 尔 代数 在 现代 计算 机 系统 设计 中 具有 重要 的 意义 。 正 是 由 于 这 个 原 
因 ， 本 章 将 介绍 布尔 逻辑 及 其 与 数字 计算 机 的 关系 。 

本 章 简要 介绍 了 导 辑 电路 设计 的 基础 知识 ， 即 布尔 代数 的 最 小 覆盖 面 ， 以 及 逻辑 门 和 基本 
数字 电路 的 代数 关系 。 任 借以 前 的 编程 经 验 ， 你 可 能 已 经 熟悉 了 基本 的 布尔 运算 符 。 毫 无 疑问 
的 是 ， 你 需要 知道 为 什么 必须 更 详细 地 人 研究 这 些 内 容 。 你 将 在 本 章 看 到 ， 布 尔 逻 辑 和 任何 计算 
机 系统 的 实际 物理 组 件 之 间 有 很 强 的 联系 。 一 名 计算 机 科学 家 可 能 不 用 设计 数字 电路 或 其 他 物 
理 组 件 ， 事 实 上 ， 本 章 也 不 准备 设计 这 样 的 项 目 。 相 反 ， 它 提供 了 足够 的 背景 知识 以 便 让 你 了 
解 计算 机 设计 和 实施 背后 的 基本 动机 。 从 编程 的 角度 来 看 ， 理 解 布尔 逻辑 如 何 影响 各 种 计算 机 
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系统 组 件 的 设计 将 让 你 更 有 效 地 使 用 任何 计算 机 系统 。 如 果 你 有 兴趣 钻研 得 更 深 ， 在 本 章 结尾 
也 列举 了 大 量 的 资源 ， 帮 助 你 进一步 研究 这 些 课题 。 


3.2 布尔 代数 


布尔 代数 是 表示 对 象 操作 的 代数 ， 它 只 有 两 个 值 ， 虽 然 它 可 以 是 任何 一 对 值 ， 但 通常 是 真 
与 假 。 因 为 计算 机 可 以 看 成 是 一 系列 “ 开 ” 或 “ 关 ” 的 开关 集合 ， 所 以 布尔 代数 可 以 很 自然 
地 表示 数字 信息 。 事 实 上 ， 数 字 电 路 采用 低 电 压 和 高 电压 ， 但 是 理解 为 0 和 1 就 足够 了 。 常 见 
的 解释 为 数字 值 0 为 假 ， 数 字 值 1 为 真 。 


3.2.1 布尔 表达 式 


除了 二 进 制 对 象 ， 布 尔 代 数 也 可 以 对 一 些 对 象 或 变量 进行 操作 。 将 变量 和 运算 符 进 行 组 合 
就 产生 了 布尔 表达 式 。 依 据 输 入 值 集合 10，11 ， 布 尔 函 数 通 常 有 一 个 或 多 个 输入 值 ， 并 产生 一 
个 输出 结果 。 

3 种 常见 的 布尔 运算 符 为 AND、OR 和 NOT。 为 了 更 好 地 理解 这 些 运算 符 ， 需 要 一 种 机 
制 来 检查 它们 的 操作 。 布 尔 运算 符 可 以 使 用 一 个 表 来 完全 描述 ， 这 个 表 列 出 了 所 有 可 能 的 
输入 、 这 些 输入 所 有 可 能 的 值 ， 以 及 这 些 输 入 组 成 的 所 有 可 能 组 合 对 应 的 结果 。 该 表 被 称 
为 真 值 表 。 真 值 表 以 表格 形式 表示 输入 变量 与 通过 布尔 运算 符 或 函数 运算 得 到 的 输出 结果 
的 关系 。 下 面 分 析 一 下 布尔 运算 符 AND、OR、NOT， 使 用 布尔 代数 和 真 值 表 查看 每 个 运算 
符 代表 的 内 容 。 

逻辑 运算 符 AND 通常 是 通过 点 或 不 用 符号 来 表示 。 例 ee 
如 ， 布 尔 表达 式 xy 等 效 于 表达 * , y 并 读 成 “x 与 y"。 表 三 
达 式 xy 通常 被 被 称 为 布尔 积 。 此 操作 行为 的 特征 真 值 表 如 
表 3-1 所 示 ， 

只 有 当 两 个 输入 均 为 1 时 ， 表 达 式 xy 的 结果 才 为 1， 
否则 为 0。 表 中 的 每 一 行 代 表 一 个 不 同 的 布尔 表达 式 ，x 和 
y 的 所 有 可 能 值 的 组 合 由 表 中 的 行 表示 。 

布尔 运算 符 OR 通常 是 由 一 个 加 号 来 表示 。 因 此 ， 表 
达 式 x+y 读 成 “x 或 y”， 只 有 当 两 者 的 输入 值 都 是 0 时 ， 
*+y 的 结果 是 0。 表 达 式 x+y 通常 被 称 为 一 个 布尔 和 。OR 
运算 的 真 值 表 如 表 3-2 所 示 。 

逻辑 运算 符 NOT 通常 表示 为 一 根 短线 或 一 个 撤 号 。 因 
此 ,无 论 是 x* 和 x' 都 被 读 为 “x 非 。 NOT 运算 符 的 真 值 表 
如 表 3-3 所 示 。 

现在 明白 了 ， 可 以 用 布尔 代数 处 理 二 进 制 变量 和 这 些 
变量 的 逻辑 运算 。 结 合 这 两 个 概念 ， 可 以 检查 由 布尔 变量 
和 多 重 逻 辑 运算 符 组 成 的 布尔 表达 式 。 例 如 ， 布 尔 函 数 

P(x,y,2) = % + y% 
是 由 3 个 布尔 变量 x*、y、z 和 逻辑 运算 符 OR、NOT 和 - 
AND 表示 的 布尔 表达 式 。 怎 么 知道 哪个 运算 符 先 操 作 ? 优 
先 级 规则 定义 为 非 最 高 ， 接 着 是 与 ， 最 后 是 或 。 对 于 函数 先 求 y 的 非 ， 然 后 执行 y' 与 z， 
最 后 将 这 个 结果 与 x 求 或 。 
也 可 以 用 真 值 表 来 表示 这 种 表达 式 。 它 往往 对 创造 一 个 更 复杂 的 功能 很 有 帮助 ， 如 建立 出 
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这 个 函数 所 有 组 合 的 真 值 表 ， 一 次 一 列 ， 直 至 该 表达 式 被 计算 出 结果 。 函 数 眉 对 应 的 真 值 表 如 
表 3-4 F(x，y，Z) =X+Wz 的 真 值 表 


表 3-4 所 示 。 

在 真 值 表 的 最 后 一 列表 示 由 x*、y 和 z 的 所 有 可 能 
组 合 得 到 的 函数 值 。 注 意 到 函数 实际 仅 由 真 值 表 前 
三 列 和 最 后 一 列 得 到 。 阴 影 列 显示 得 到 最 后 答案 所 需 
的 中 间 步 骤 。 创 建 这 种 真 值 表 可 以 更 容易 地 评价 函数 
对 于 所 有 输入 值 的 可 能 组 合 的 情况 。 


3. 2.2 布尔 代数 的 基本 定律 

通常 ， 布 尔 表达 式 不 会 用 最 简 的 形式 来 表示 。 这 
就 好 比 代 数 表达 式 2x + 6x 并 不 是 最 简 形 式 一 样 ， 它 
可 以 化 简 (以 较 简 或 更 简 的 形式 来 表示 ) 为 8x。 布尔 
表达 式 也 可 以 化 简 , 但 需要 新 的 定律 来 应 用 于 布尔 代数 中 ， 从 而 代替 普通 代数 的 化 简 规则 。 这 
些 定律 适用 于 单 布尔 变量 以 及 布尔 表达 式 ， 如 表 3-5 所 示 。 请 注意 ， 每 个 关系 (最 后 一 个 除外 ) 
同时 具有 一 个 AND( 乘 积 ) 的 形式 和 一 个 OR( 求 和 ) 的 形式 。 这 被 称 为 对 偶 规则 。 


表 3-5 布尔 代数 的 基本 定律 




































































定律 名 
同一 律 lw=% 0 +% = 区 
零 律 Ox=0 1 +x=1 
宕 等 律 XX =% 和 
逆 等 律 M =0 %+%! =1 
交换 律 XY = yx 和 十 多 三 二 区 
结合 律 (xy)z=%()z) (x+y) +z=x+(y+2) 
分 配 律 xX+(yz) =(x+y)(x+z) x(y+z) =xy+Xz 
吸收 律 Xx(X+Y) =x | TX+NXY =% 
德 摩根 定律 (xy) =%’ +》 (x+Y) =X 
双重 否定 律 X=% 








同一 律 规定 任何 布尔 变量 与 1 相 与 或 者 与 0 相 或 都 只 会 得 到 原 变量 (1 为 AND 的 同一 元 素 ; 
0 为 或 的 同一 元 素 ) 。 零 律 规定 任何 布尔 变量 与 0 相 与 为 0， 任 何 一 个 变量 与 1 相 或 始终 为 1。 
震 等 律 指出 一 个 变量 与 自己 进行 与 运算 或 者 或 运算 都 得 到 原 变量 。 逆 等 律 规定 与 反 变量 进行 与 
运算 或 者 或 运算 会 产生 给 定 操作 的 符号 。 布 尔 变量 可 以 重新 排序 (交换 ) 和 重组 (结合 ) ， 而 不 
会 影响 最 后 的 结果 。 你 应 该 知道 普通 代数 中 的 交换 律 和 结合 律 。 分 配 律 表示 或 运算 如 何 变 成 与 
运算 ， 反 之 亦 然 。 

吸收 律 和 德 摩根 定律 就 不 那么 明显 了 ,但 是 可 以 通过 创建 各 种 表达 式 的 真 值 表 来 证 明 这 些 
定律 : 如 果 右 侧 等 于 左 侧 ， 那 么 表达 式 表示 相同 的 功能 和 结果 相同 的 真 值 表 。 表 3-6 表示 德 摩 
根 定律 对 于 真 值 表 的 左 侧 和 右 侧 进行 与 运算 。 剩 下 定律 有 效 性 的 证 明 留 作 练习 ， 特 别 是 ， 德 摩 
根 定律 中 的 或 和 吸收 律 中 的 两 种 形式 。 
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双重 和 否定 律 对 双重 否定 进行 了 形式 化 定义 ， 这 类 做 高 中 英语 教师 教 的 方法 。 双 重 否 定律 在 
数字 电路 和 生活 中 都 非常 有 用 。 例 如 ， 令 * =1 表示 有 现金 ， 如 果 没 有 现金 用 * 表 示 。 当 一 个 
不 值得 信任 的 熟人 想 借 些 现 金 ， 即 使 刚 发 了 薪水 ， 你 也 可 以 说 没有 没 钱 ， 即 * = (*)"。 

其 中 初学 者 常 犯 的 错误 是 在 学 习 布 尔 逻 辑 时 ,假设 (xy)' =x'y'。 请 注意 ， 这 不 是 一 个 有 效 
的 等 式 ! 德 摩根 定律 清楚 地 表明 ， 这 种 说 法 是 不 正确 的 。 而 它 应 该 是 ，(%y)'=x' +y'。 这 是 一 
个 很 容易 犯 的 错误 ， 也 是 一 个 应 该 避免 的 错误 。 必 须 注意 其 他 涉及 否定 的 表达 式 。 


3.2.3 化 简 布 尔 表达 式 
按照 代数 课 学 习 的 代数 定律 ， 能 够 将 代数 表达 式 10x +2y -x+3y 化 简 为 它 的 简单 形式 
9x +5y。 布尔 定律 可 以 用 类 似 的 方式 简化 布尔 表达 式 。 在 下 面 的 例子 中 应 用 这 些 定律 。 
假设 有 函数 x，y) =xy +xy。 假 设 表达 式 中 x 和 为 布尔 变量 ,使 用 OR 的 短 等 
律 简化 原始 表达 式 为 xy。 因 此 , F(x, y) =xy +xy =xy。o a 
对 于 给 定 函 数 了 x，y，z) =x'yz+x'yz +xz， 简 化 如 下 : 
F(X%,Y,2) = Wye + Ny + Nz 
= wx'y(z +z') +xz (分 配 律 ) 
三 yl ( 逆 等 律 ) 
= %'y 十 %z (同一 律 ) < 
对 于 给 定 函 数 F(z，y) =y+ (xy)'， 简 化 如 下 : 
F(x,y) = y+ (xy)" 
=y+ (x +y) ( 德 摩根 定律 ) 
=y+(y +x') (交换 律 ) 
= (y+Yy) +x% (结合 律 ) 
=1+% ( 逆 等 律 ) 
= 1 ( 零 律 ) 4 
对 于 给 定 函 数 P(z，y) = (xy) ‘(x'+y)(y'+y)， 简 化 如 下 : 
Fg,y) = (xy) (5 二 7) 人 7 +7) 
= (xy)' (x’' +7y)(1) ( 逆 等 律 ) 


= (wy) (x 4 y) (同一 律 ) 

= (x’+y’)(x’ +y) ( 德 摩根 定律 ) 

= x +y'y (对 于 与 的 分 配 律 ) 

=x'+0 ( 逆 等 律 ) 

一 ( 老 等 律 ) 


有 时 ， 简 化 是 相当 简单 的 ， 如 前 面 例 子 所 示 。 但 是 ， 使 用 的 定律 可 能 会 非常 棘手 ， 来 看 下 
面 两 个 例子 。 
对 于 给 定 函数 (x，y) =x'(z+y) +(y+x)(z+y)， 简 化 如 下 : 
F(x,y) =%(x +Yy)+(y+x)(Cx+Y) 
=2(xt+7) +(C5+y CS+TY) (交换 律 ) 


可 玫 交 于 下 大 和 (有 二 殉 六 (对 于 与 的 分 配 律 ) 
= (w+y) t+ (z+0) ( 逆 等 律 ) 
= x (%+y) +% (同一 律 ) 
=X%+XYy+% (分 配 律 ) 


=0+xy+x ( 逆 等 律 ) 





= y+ (同一 律 ) 

=% 十 %Y (交换 律 ) 

= (x%+%')(x+y) (对 于 与 的 分 配 律 ) 

= 1(% +7) ( 逆 等 律 ) 

三 :下 : 亚 (同一 律 ) 本 


对 于 给 定 函 数 F(x，yY，z) = sy +xz+ 和 2， 简 化 如 下 : 
FR(w yz) = LyNz 人 tye 


=xy +x'z+yz(1) (同一 律 ) 

= xXy +xz+y(x+x') ( 逆 等 律 ) 

= XYy +%'z+(Yyz)xX + (yz) x (分 配 律 ) 

= xy + Xz +x(yz) +X (zy) (交换 律 ) 

= xy +xz+ (xy)z + (xz)y (两 次 结合 律 ) 

= My + (xy)z + z+ (Xz)y (交换 律 ) 

= xy(l1 +z) +%z(l1 +y) (分 配 律 ) 

= xy(1) +x'z(1) ( 零 律 ) 

= Xxy 十 %'z (同一 律 ) a 


例 3.6 说 明了 什么 是 俗称 的 共识 定理 。 
如 何 插 入 附加 法 则 以 简化 例 3.6 中 的 函数 ? 不 幸 的 是 ， 可 以 没有 任何 限定 地 使 用 这 些 定 律 
来 化 简 到 最 简 布 尔 表 达 式 ， 只 是 需要 一 些 经 验 。 后 面 章节 会 提 到 有 一 些 可 简化 布尔 表达 式 的 其 
他 方法 。 
还 可 以 利用 这 些 定 律 证 明 布尔 等 式 ， 如 例 3.7 所 示 。 
证 明 (x+y)(x'+y) =y。 
(x+y)(x'+y) =xx +xy+yx' +yy (分 配 律 ) 
=0+xy+yx + yy ( 逆 等 律 ) 
=0+xy+yx +y (和 老 等 律 ) 


= Xxy + YX +y (同一 律 ) 
= x+yx +y (交换 律 ) 
= y(x+x’) +y (分 配 律 ) 
= CL + ( 逆 等 律 ) 
=y+y (同一 律 ) 
=y (和 军 等 律 ) < 


为 了 证 明 两 个 布尔 表达 式 相等 ， 可 以 创建 真 值 表 进行 比较 。 如 果真 值 表 相同 ， 则 表达 式 相 
等 。 可 以 把 例 3. 7 作为 一 个 练习 来 证 明 真 值 表 相 等 。 


3.2.4 求 反 


正如 在 例 3. 1 中 看 到 的 ， 布 尔 定律 不 仅仅 可 以 应 用 到 简单 的 布尔 变量 (把 x 和 y 看 作 布 尔 
变量 并 应 用 需 等 律 ) ， 还 可 以 应 用 到 布尔 表达 式 中 。 这 同样 适用 于 布尔 运算 符 。 应 用 于 更 复杂 
布尔 表达 式 中 的 最 常见 的 布尔 运算 符 是 NOT 运算 符 ， 它 表示 对 表达 式 求 反 。 很 多 时 候 ， 更 容 
易 求 出 一 个 函数 的 反而 不 是 函数 本 身 。 如 果 进 行 反 运算 ， 则 必须 反 转 最 终 输出 以 得 到 原来 的 函 
数 。 用 一 个 简单 的 NOT 运算 就 能 完成 。 因 此 ， 求 反 运 算是 非常 有 用 的 。 

用 德 摩根 定律 可 以 找到 一 个 布尔 函数 的 反 。 该 定律 的 或 形式 规定 (x+y) =x'y'。 可 以 很 容 
易 将 其 扩展 到 3 个 或 更 多 的 变量 中 : 
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假设 两 数 为 : 

F(x, y, 2) =(x+y+z); 于 是 F(x%, YY 2) =(%4+y+z)'s 设 w=(x+y), 则 F(x, y, 2z) = 
(w+2z)' =w'z'o 

现在 ， 再 次 应 用 德 摩根 定律 得 到 : 

1 

因此 ， 如 果 F(x, y, z) = (x+7y+z)， 则 已 (x%，y，z) =x'y'z'。 应 用 对 偶 原理 ,得 到 (xyz)'= 
xX +y +2Z'o 

看 来 ， 要 想 找到 一 个 布尔 表达 式 的 反 ， 可 简单 地 用 它 的 反 (x 用 x" 代替) 并 交换 AND 和 OR 
运算 。 事 实 上 ， 这 正 是 德 摩根 定律 所 阐述 的 。 例 如 x'+yz' 的 反 是 x(y' +z) ， 必 须 添加 括号 以 确 
保 正确 的 优先 级 。 

可 以 验证 ， 通 过 这 种 简单 规则 寻找 到 的 布尔 表达 式 的 反 是 正确 的 ， 可 以 通过 真 值 表 检查 表 
达 式 和 它 的 反 。 当 任何 表达 式 的 反 表示 为 真 值 表 时 ,输出 为 0 时 原 函 数值 为 1， 输 出 为 1 时 原 
函数 值 为 0。 表 3-7 描绘 了 F(x，y,，z) =x' +yz' 函 数 和 它 的 反正 (x,，y,z) =x(y' +z) 表 示 ， 阴 
影 部 分 指示 FF 和 户 的 最 终结 果 。 


表 3-7 一 个 函数 和 它 的 反 的 真 值 表 
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3.2.5 表示 布尔 函数 


在 前 面 已 经 看 到 ， 可 以 有 许多 不 同 的 方式 来 表示 给 定 的 布尔 函数 。 例 如 ， 可 以 用 一 个 真 值 
表 , 或 者 使 用 许多 不 同类 型 的 布尔 表达 式 。 事 实 上 ， 有 无 限 多 个 布尔 表达 式 在 逻辑 上 等 同 。 可 
以 由 同一 个 真 值 表 来 表示 的 两 个 表达 式 被 认为 逻辑 上 是 等 同 的 ( 见 例 3. 8)。 

假设 R(x，y，z) =x+xy'。 可 以 表示 玉 为 F(x, y,z) =x+%x+xy ， 因 为 按照 客 
等 律 这 两 个 表达 式 是 一 样 的 。 也 可 以 用 分 配 律 表示 为 F(x, y, z) =x(1 +y')。 a 

为 了 消除 潜在 的 混乱 ， 数 字 逻 辑 设计 师 指 定 布尔 函数 应 使 用 规范 或 标准 化 的 格式 。 对 于 任 
何 给 定 的 布尔 函数 ， 存 在 唯一 的 标准 格式 。 不 过 ， 设 计 者 也 使 用 不 同 的 “标准 ”。 两 种 最 常见 
的 是 和 的 乘积 和 乘积 的 和 这 两 种 形式 。 

乘积 的 和 形式 要 求 表达 式 是 一 些 项 与 变量 (或 乘积 项 ) 的 集合 ， 然 后 进行 求 和 运算 。 函 数 
F(x,，y，z) =2y + +32yz 就 是 乘积 的 和 的 形式 。 卫 数 已 (*，y，z) =xy' +x(y+z') 不 是 乘积 
的 和 的 形式 。 在 Ff, 函数 中 对 于 x 应 用 分 配 律 使 其 变 成 表达 式 xy' + xy +xz'， 这 是 乘积 的 和 
形式 。 

和 的 乘积 表示 的 布尔 表达 式 是 或 运算 变量 ( 求 和 项 ) ,然后 进行 与 运算 。 也 数 F(x， 
y,，z) =(x+y)(x+z)(y+z)(y+z) 为 和 的 乘积 形式 ， 在 很 多 情况 下 ， 当 判断 布尔 表达 
式 为 真 而 不 是 假 时 ， 首 选 和 的 乘积 形式 。 这 是 与 消 数 F 不 一 样 的 情况 ， 乘积 的 和 的 形式 
适合 这 种 情况 。 而 且 乘 积 的 和 的 形式 通常 比较 容易 使 用 ， 因此， 在 后 面 的 章节 只 使 用 这 
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种 形式 。 
任何 布尔 表达 式 都 可 以 用 乘积 的 和 形式 来 表示 。 因 为 任何 布尔 表达 式 都 可 以 表示 为 一 个 真 
值 表 ， 结 论 是 任何 真 值 表 也 可 以 表示 为 乘积 的 和 形式 。 从 例 3. 9 中 可 以 看 到 将 真 值 表 转换 成 乘 
积 的 和 形式 是 很 简单 的 。 
考虑 一 个 简单 的 择 多 困 数 。 对 于 这 表 3-8 择 多 函数 的 真 值 表 
个 函数 来 说 ， 当 给 出 3 个 输入 时 ， 如 果 输 入 为 1 x 
的 变量 不 到 一 半 时 ,输出 为 0; 如 果 输 入 变量 至 0 
少 有 一 半 为 1 时, 输出 为 1。 表 3-8 描述 了 这 个 具 
0 
1 











a 





有 3 个 变量 的 择 多 也 数 的 真 值 表 。 

下 面 将 乘积 和 的 形式 转换 为 真 值 表 ， 并 通 
过 结果 来 分 析 问 题 。 如 果 希 望 表达 式 x*+y 等 于 一 一 一 | 
1， 则 >* 或 y( 或 两 者 ) 等 于 1。 如 果 xy +yz =1， 1 | 
则 xy=1 或 yz=1 或 两 者 均等 于 1。 1 

反 向 使 用 这 个 逻辑 ， 并 把 它 应 用 到 择 多 郴 
数 ， 可 以 看 到 当 x=0、y=1、z=1 时 该 函数 必须 输出 1， 满足 这 个 条 件 的 乘积 项 是 x'yz( 显 
然 ; 此 项 等 于 1 时， 因为 z=0、 y=1 z=1)s。 当 w=1, 7=0、 z=1 时 ;输出 值 为 1 第 三 次 
出 现 ， 满 足 这 个 条 件 的 乘积 项 是 xy'z。 需 要 的 第 三 个 乘积 项 是 zyz'， 最 后 是 zyz。 总 之 ， 要 使 
用 真 值 表 产 生 一 个 乘积 和 的 形式 的 布尔 表达 式 ， 必 须 生成 对 应 于 各 行 的 输入 变量 的 乘积 项 ， 
其 中 每 一 行 输 出 变量 的 值 是 1。 在 每 一 个 乘积 项 中 ,我们 必须 对 那 一 行 中 每 一 个 为 0 的 变量 
进行 求 反 。 

择 多 函数 可 以 表达 为 乘积 和 的 形式 ,如 F(x, y， z) =x'yz +Xy'z+Xyz' +Xyzo | 

请 注意 ， 对 于 例 3.9 所 示 的 择 多 函数 的 表达 式 可 能 不 是 最 简单 的 形式 ， 而 只 是 一 个 标准 形 
式 。 该 乘积 的 和 形式 以 及 和 的 乘积 的 形式 是 等 价 的 布尔 函数 表示 方式 。 通 过 布尔 定律 ， 一 种 形 
式 可 以 转换 为 另 一 种 形式 。 无 论 使 用 乘积 的 和 形式 或 和 的 乘积 形式 ， 表 达 式 最 终 必 须 转化 成 最 
简 形 式 ， 这 意味 着 使 表达 式 的 项 减少 到 了 最 小 。 为 什么 一 定 要 简化 表达 式 ?” 在 表达 式 中 不 必要 
的 项 会 在 物理 电路 中 产生 不 需要 的 组 件 ， 这 会 产生 一 个 次 优 电 路 。 我 们 将 在 下 一 节 讲 述 布尔 表 
达 式 与 对 应 电路 。 
3.3 逻辑 门 

迄今 为 止 ， 已 经 讨论 过 逻辑 运算 符 AND 、OR 和 NOT, 但 在 抽象 意义 上 使 用 的 是 真 值 表 和 
布尔 表达 式 。 实 际 的 物理 组 件 或 数字 电路 ( 如 执行 算术 运算 的 组 件 或 计算 机 中 的 选择 器 ) 是 由 
许多 称 为 门 的 基本 元 素 构成 的 。 前 面 已 经 讨论 过 门 电路 实现 的 每 个 基本 逻辑 功能 ， 这 些 门 电路 
是 数字 设计 中 的 基本 构造 部 件 。 在 形式 上 ， 门 电路 是 用 来 计算 二 值 信号 函数 的 小 型 电子 设备 。 
更 简单 地 说 ， 门 电路 实现 了 简单 的 布尔 函数 。 物 理 上 的 实现 需要 一 个 到 六 个 或 更 多 个 晶体 管 
( 见 第 1 章 所 述 ) ， 这 取决 于 所 使 用 的 技术 。 总 之 ， 一 台 计 算 机 的 基本 物理 组 件 是 晶体 管 ， 基 本 
逻辑 器 件 是 门 电 路 。 


3. 3.1 逻辑 门 符号 

最 开始 先 研 究 3 个 最 简单 的 逻辑 门 。 它 们 对 应 于 逻辑 运算 符 AND、OR 和 NOT。 前 面 已 
经 讨论 了 这 些 布尔 运算 符 的 功能 行为 。 图 3-1 所 示 为 每 一 个 运算 符 对 应 的 逻辑 门 的 图 形 化 
表示 。 

注意 非 门 输出 处 的 圆圈 。 通 常情 况 下 ， 这 个 圆圈 代表 求 反 操作 。 
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3 人- 


或 门 非 门 
图 3-1 3 个 基本 的 逻辑 门 


男 一 种 常见 的 门 是 异 或 (XOR) 门 ， 其 布尔 表达 式 为 x*@@y。 如 果 两 个 输入 值 相同 ， 那 么 异 
或 的 结果 为 假 ， 否 则 为 真 。 图 3-2 显示 了 XOR 的 真 值 表 以 及 代表 其 行为 的 逻辑 图 。 











a ) XOR 的 真 值 表 b ) XOR 的 逻辑 符号 


3. 3.2 通用 逻辑 门 


其 他 两 种 常见 的 门 是 NAND( 与 非 门 ) 和 NOR( 或 非 门 )， 它 们 分 别 从 AND 和 OR 产生 反 向 
输出 。 每 个 门 有 两 个 不 同 的 逻辑 符号 ， 这 个 符号 是 用 门 表示 的 。( 作 为 一 个 练习 ,证 明 符 号 在 
逻辑 上 等 同 。 提 示 : 使 用 德 摩根 定律 .) 图 3-3 和 图 3-4 给 出 了 NAND 和 NOR 的 逻辑 图 ， 并 使 用 
真 值 表 解 释 了 每 个 门 的 功能 行为 。 










图 3-3 NAND 的 真 值 表 和 逻辑 符号 


x 咕 
(x+y) 好 区 =(x+y) 
y y 


图 3-4 NOR 的 真 值 表 和 逻辑 符号 


NAND 门 通常 被 称 为 通用 逻辑 门 ， 因 为 任何 电子 电路 都 可 以 仅 使 用 与 非 门 来 构造 。 为 了 证 
明 这 一 点 ， 图 3-5 只 使 用 与 非 门 表示 出 了 与 门 、 或 门 和 非 门 。 

那么 为 什么 不 简单 地 使 用 AND 、OR 和 NOT 这 些 已 经 知道 的 逻辑 门 呢 ? 仅 使 用 与 非 门 构建 
任何 给 定 的 电路 主要 有 两 个 原因 。 第 一 ， 与 非 门 比 其 他 门 成 本 更 低 。 其 次 ， 相 对 于 使 用 基本 组 
件 的 集合 ( 即 AND 、OR 和 NOT 门 的 组 合 ) ， 复 杂 的 集成 电路 (在 下 面 的 章节 中 讨论 ) 通 常 使 用 
相同 的 组 件 ( 即 若干 与 非 门 ) 构 建 更 容易 。 


x ~ 
| oRy 








31] 或 门 非 门 
图 3-5 3 个 只 使 用 与 非 门 构建 的 逻辑 电路 
请 注意 ， 对 偶 原 理 也 具有 普遍 性 。 可 以 建立 只 使 用 或 非 门 的 电路 ， 与 非 门 和 或 非 门 以 和 的 
乘积 形式 和 乘积 的 和 形式 呈现 。 一 般 在 乘积 的 和 中 使 用 与 非 门 ， 在 和 的 乘积 中 使 用 或 非 门 。 
3. 39.3 多 输入 逻辑 门 


到 目前 为 止 的 例子 中 ， 所 有 门 只 接收 两 个 输入 。 但 是 ， 门 并 不 限于 只 有 两 个 输入 值 。 在 各 
种 逻辑 门 中 允许 输入 和 输出 有 许多 种 不 同 的 类 型 和 数量 。 例 如 ， 如 图 3-6 所 示 ， 我 们 可 以 用 一 
个 三 输入 的 或 门 表示 表达 式 x +y+z。 图 3-7 代表 表达 式 xy'z。 

在 本 章 后面 将 看 到 ， 在 描述 门 的 输出 0 时 ， 同 时 给 出 0' 将 十 分 有 用 。 如 图 3-8 所 示 。 


X+y+2 xXy'Z 2 
» 及 
Zz Zz 上 C 


图 3-6 表示 *+y+z 的 三 图 3-7 表示 xy'z 的 三 输入 与 门 图 3-8 有 两 个 输入 和 两 个 
输入 或 门 输出 的 与 门 
注意 ，0Q 总 表示 实际 输出 。 
3.4 数字 组 件 


在 打开 一 台 计算 机 并 观察 内 部 结构 时 ， 人 们 会 认识 到 有 很 多 组 成 系统 的 数字 组 件 需 要 了 
解 。 所 有 计算 机 使 用 的 都 是 逻辑 门 的 集合 ， 它 们 通过 导线 作为 信号 通路 建立 连接 。 这 些 逻 辑 门 
往往 都 是 标准 化 的 ， 使 得 可 用 一 组 模块 构建 整个 计算 机 系统 。 令 人 惊奇 的 是 ， 这 些 模块 都 利用 
基本 的 AND、OR 和 NOT 构造 。 在 接 下 来 的 几 节 中 ,将 讨论 数字 电路 与 布尔 代数 的 关系 、 标 准 
模块 和 两 个 不 同类 别 的 示例 ， 以 及 构建 这 些 模 块 需要 的 组 合 逻 辑 和 时 序 逻 辑 。 


3.4.1 数字 电路 及 其 与 布尔 代数 的 关系 


布尔 函数 和 数字 电路 之 间 有 什么 关系 ? 可 以 看 出 ， 简 单 的 布尔 运算 (如 AND 或 OR ) 可 
以 通过 简单 的 逻辑 门 来 表示 。 更 复杂 的 布尔 表达 式 可 以 表示 为 AND、OR 和 NOT 门 的 组 合 ， 
这 样 可 以 用 一 个 逻辑 图 描述 整个 表达 式 。 这 个 逻辑 图 从 物理 组 件 上 表示 给 定 表达 式 ， 或 实 
际 的 数字 电路 。 假 设 函 数 Rx，y，z) =x+y'z( 前 面 介绍 过 )。 图 3-9 所 示 为 实现 此 函数 的 逻 
辑 图 。 


无 
X+yz 


由 


2 


图 3-9 表示 F(x,y, z) =x +y'z 的 逻辑 电路 图 
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回想 一 下 关于 乘积 的 和 形式 的 讨论 。 这 种 形式 非常 适用 于 数字 电路 。 例 如 ， 假设 函数 为 
f(x, y，z) =xy+yz'+xyz， 其 中 每 项 对 应 于 一 个 与 门 ， 其 和 由 一 个 或 门 实现 ， 从 而 产生 以 下 
电路 : 


我 们 可 以 为 任何 布尔 表达 式 建立 逻辑 图 (这 反 过 来 又 产生 数字 电路 ) 。 在 一 定 程 度 上 ， 由 
计算 机 执行 的 每 个 操作 都 是 一 个 布尔 表达 式 的 实现 。 对 于 高 级 语言 程序 员 ， 这 可 能 不 是 很 明 
显 ， 因 为 高 级 语言 和 布尔 逻辑 存在 语义 鸿沟 。 汇 编 语言 程序 员 更 接近 硬件 ， 使 用 布尔 技巧 能 加 
速 程序 性 能 。 使 用 XOR 运算 符 可 以 清除 存储 单元 的 值 ， 如 4 XOR 4。XOR 运算 符 也 可 用 于 交 
换 两 个 存储 单元 的 值 。 同 样 的 XOR 语句 应 用 于 两 个 变量 3 次 ， 比 如 说 4 和 B， 交 换 它们 的 值 : 

A= AXORB 
B= AXORB 
A= AXORB 

在 高 级 语言 中 位 掩 码 几乎 是 不 可 能 实现 的 ， 即 根据 指定 的 模式 把 一 个 字 节 的 各 位 剥离 ( 设 
置 为 0) 。 在 处 理 字 节 的 各 个 位 时 ， 布 尔 位 掩 码 操作 是 必 不 可 少 的 。 例 如 ， 如 果 要 找 出 一 个 字 
节 的 第 四 个 位 是 否 被 设置 ， 将 字 节 和 04( 十 六 进 制 ) 进行 与 运算 ， 如 果 结 果 不 为 0， 则 该 位 等 于 
1， 掩 码 能 屏蔽 任何 位 。 在 想 要 保留 的 那个 位 的 位 置 放置 1， 并 设置 其 他 为 0， 用 AND 运算 留 
下 所 需要 的 位 。 

通过 布尔 代数 可 分 析 和 设计 数字 电路 。 因 为 布尔 代数 和 侵 辑 图 之 间 存 在 关系 ， 通 过 简化 布 
尔 表达 式 也 就 简化 了 电路 。 数 字 电 路 使 用 逻辑 门 来 实现 ， 但 逻辑 门 和 逻辑 图 并 不 是 在 设计 阶段 
代表 数字 电路 最 方便 的 形式 。 布 尔 表 达 式 在 此 阶段 使 用 是 因为 它们 更 易于 操作 和 简化 。 

由 表达 式 表示 的 布尔 函数 的 复杂 性 对 所 得 到 的 数字 电路 的 复杂 性 有 直接 影响 : 更 复杂 的 表 
达 式 就 会 得 到 更 复杂 的 电路 。 应 该 指出 的 是 ， 通 常 不 会 使 用 布尔 定律 来 简化 电路 。 前 面 已 经 看 
到 ， 有 时 这 可 能 是 相当 困难 和 耗费 时 间 的 事 。 但 是 设计 师 可 使 用 更 自动 化 的 方法 来 做 到 这 一 
点 。 该 方法 涉及 利用 卡 诺 图 (Kmaps ) 来 进行 逻辑 电路 的 简化 。 阅 读本 章 “ 特别 关注 "以 了 解 卡 
诺 图 如 何 用 于 简化 数字 电路 。 


3.4.2 集成 电路 


计算 机 是 由 各 种 数字 组 件 通过 导线 连接 而 构成 的 。 类 似 于 一 个 组 织 结构 优秀 的 程序 ， 计 算 
机 的 硬件 通过 基本 门 电路 去 构造 更 大 的 硬件 模块 ， 反 过 来 这 些 模块 用 于 实现 各 种 功能 。 构 造 这 
些 基 本 模块 所 使 用 的 门 电路 的 数量 取决 于 所 使 用 的 具体 技术 。 电 路 技术 已 经 超出 了 本 书 的 范 
围 ， 你 可 以 阅读 本 章 结尾 的 参考 文献 ， 以 了 解 关 于 这 个 主题 的 更 多 信息 。 

通常 情况 下 ， 门 电路 不 单独 出 售 。 它 们 以 集成 电路 (1C ) 为 单元 售 出 。 芯 片 ( 硅 半导体 晶 
体 ) 通 常 是 一 个 小 型 电子 设备 ， 它 由 实现 各 种 门 电路 的 基本 电子 元 器 件 ( 晶体管、 电阻 和 电容 ) 
组 成 。 如 之 前 提 到 的 ， 它 们 被 直接 蚀刻 在 芯片 上 ， 从 而 使 占用 的 面积 更 小 ， 相 比分 立 元 器 件 也 
更 省 电 。 然 后 ， 芯 片 再 被 封装 在 具有 外 部 引 脚 的 陶瓷 或 塑料 容器 中 。 芯 片 到 外 部 引 脚 间 的 必要 
连接 是 通过 焊接 完成 的 ， 从 而 形成 集成 电路 。 第 一 代 集 成 电路 包含 很 少 的 晶体 管 。 正 如 我 们 所 
知道 的 ， 在 称 为 SSI 芯片 的 第 一 代 集成 电路 中 每 个 芯片 包含 100 个 电子 元 器 件 。 在 现在 的 超大 
规模 集成 电路 (ULSI) 中 ， 每 个 芯片 能 包含 超过 100 万 个 电子 元 器 件 。 图 3-10 给 出 了 一 个 简单 
的 SSI 集成 电路 。 


Ke 
名 
油 
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图 3-10 简单 的 SSI 集成 电路 图 


前 面 已 经 看 到 ， 可 以 将 任何 布尔 函数 表示 为 以 下 形式 : 真 值 表 ,布尔 表达 式 ( 乘积 的 和 的 
形式 ) ， 使 用 门 电路 符号 的 逻辑 图 。 考 虑 由 下 述 真 值 表 所 表示 的 功能 : 


oln 
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己 | 吕 | 口中 | 一 | 一 | 吕 | 吕 























mm | | 一 | 已 | 所 | 已 
一 | 一 | 己 | 忆 | 一 | 一 | 己 | 口 改 


Zz 
0 
1 
0 
1 
0 
由 
0 
1 





这 个 函数 以 乘积 的 和 的 形式 表示 为 F(x，y，z) =x'yz' +x'yz。 简 化 为 F(x,y, z) =x'y( 简 
化 过 程 留 给 读者 进行 练习 ) 。 现 在 可 以 使 用 如 下 的 逻辑 图 表示 : 


x Xy 
y 


仅 使 用 与 非 门 ， 就 可 以 重新 绘制 逻辑 图 ， 如 下 所 示 : 


于 5 
(xy ) =x+y 
Dr )=x'y 
» 


可 以 利用 图 3-10 所 示 的 SSI 电路 硬件 来 实现 ， 如 下 所 示 : 


Rw 2 sy 
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3.4.3 汇总 : 从 问题 描述 到 电路 

现在 我 们 理解 了 如 何 通过 布尔 表达 式 来 表示 函数 ， 如 何 化 简 布尔 表达 式 ， 以 及 如 何 使 用 逻 
辑 图 来 表示 布尔 表达 式 。 下 面 综合 这 些 技能 从 头 到 尾 来 设计 一 个 逻辑 电路 。 

人 多 假设 任务 是 设计 一 个 逻辑 电路 以 帮助 确定 花园 种 植 的 最 佳 时 机 。 调 查 3 种 可 能 
因素 : (1) 时 间 ， 其 中 0 表示 白天 、1 表示 晚上 ; (2) 月 相 变化 ， 其 中 0 表示 半月 、1 表示 满 
月 ; (3) 温度 ， 其 中 0 表示 45 衬 (1 下 =5《/9Y ) 及 以 下 、1 代表 45 下 及 以 上 。 以 上 3 个 因素 代表 
输入 。 认 真 调研 后 ， 确 定 最 佳 的 花园 种 植 时 机 是 满月 的 晚上 (温度 似乎 无 关 紧 要 ) 。 这 将 得 到 
以 下 真 值 表 : 





月 亮 (人 |， 温度 (2 | 种植? 
0 














0 
Wr 
1 
1 
0 














二 | 一 | 一 | 一 | 号 | 口号 | 虽 





Sl= | | | 





当 输 入 为 “夜间 ”和 “满月 ”时 ,将 输出 列 设置 为 1， 而 表 中 其 他 地 方 设置 为 0。 将 真 值 
表 转 换 为 布尔 函数 F， 得 到 R(x，y，z) =xyz' +xyz( 使 用 例 3.9 、 
中 提出 的 类 似 方法 : 包括 函数 计算 结果 为 1 的 项 ) 。 现 在 简化 下 加 
并 使 用 吸收 律 得 到 : » 

(xy a) = Wye 4 Ny = Wy 

因此 ,该 函数 是 使 用 x 和 y 作为 输入 的 与 门 。 | 

设计 一 个 布尔 电路 的 步骤 如 下 : (1) 认真 阅读 问题 确定 输入 和 输出 值 ; (2) 建立 一 个 真 值 
表 以 显示 出 对 于 所 有 可 能 输入 的 输出 ; (3) 将 真 值 表 转 换 成 布尔 表达 式 ; (4) 简化 布尔 表 
达 式 5 

(ESD 假设 你 负责 设计 一 个 电路 ， 以 便 让 你 的 大 学 校长 根据 天 气 状况 来 决定 是 否 关 
闭 学 校 。 如 果 公 路 部 门 还 没有 用 盐 处 理 道路 ,而 且 道 路 上 有 冰 ， 校 园 应 该 关闭 。 不 管道 路 
上 是 否 有 冰 或 盐 ， 只 要 有 大 于 8in( 约 20cm) 厚 的 雪 ， 校园 应 关闭 。 在 其 他 情况 下 ， 校 园 应 该 
开放 。 

有 3 个 输入 : 冰 ( 或 无 冰 ) 、 盐 (或 无 盐 ) ， 以 及 道路 上 超过 8in 的 雪 ( 或 没有 ) ， 从 而 产生 
以 下 真 值 表 : 
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利用 真 值 表 得 到 布尔 表达 式 R(x，y，z) =x'y'z+x'yz +xy'z +xy'z+xyz 可 以 使 用 布尔 定 
理化 简 表 达 式 如 下 : 


F(x,y,2) = XYZ 十 % yz + XYz + XY'Z + XYZ 


= XYZ + XY + AYZ 十 MYZ 十 MY OZ (交换 律 ) 

=%(Yz+yz) +x(y'z+yz) +xy'z (使 用 两 次 分 配 律 ) 

= (x +XY)(7z +y2) + xy'z’ (分 配 律 ) 

= (yz + y) + wy ( 逆 等 律 / 同一 律 ) 
= (分 配 律 ) 

= 二 Wy 〈 逆 等 律 / 同一 律 ) | 


留 给 读者 画 出 与 z+xy'z' 对 应 的 逻辑 图 。 一 旦 电路 已 用 硬件 实现 ， 所 有 大 学 校长 只 需要 设 
置 当 前 输入 的 条 件 ， 输 出 就 会 告诉 他 是 否 关闭 校园 。 


3.5 组 合 逻 辑 电 路 
数字 逻辑 芯片 的 组 合 可 以 提供 有 用 的 电路 。 这 些 逻 辑 电 路 可 分 为 组 合 逻 辑 电路 和 时 序 罗 辑 
电路 。 本 节 将 介绍 组 合 逻辑 电路 。 时 序 逻 辑 电路 详 见 3.6 节 。 


3.5.1 基本 概念 


组 合 逻 辑 是 用 来 建立 包含 基本 输入 和 输出 的 布尔 运算 电路 。 确 定 一 个 电路 是 否 为 组 合 电路 
的 关键 是 该 电路 的 输出 始终 与 给 定 的 输入 相关 (如 例 3. 10 和 例 3. 11 中 看 到 的 ) 。 因 此 ， 组 合 电 
路 的 输出 是 输入 的 函数 ， 任 何 时 刻 输 出 值 都 由 输入 值 唯一 确定 。 一 个 给 定 的 组 合 电 路 可 以 有 多 
个 输出 。 这 样 的 话 ， 每 个 输出 都 由 不 同 的 布尔 函数 来 表示 。 


3. 5.2 典型 的 组 合 逻 辑 电 路 示例 

首先 ， 从 一 个 非常 简单 的 组 合 逻辑 电路 一 一 半 加 器 开始 。 

考虑 两 个 二 进 制 数 相 加 的 问题 。 表 3-9 ” 半 加 器 的 真 值 表 
有 3 件 事情 要 记 住 ; 0 +0=0, 0+1=1+0=1， : 
1+1=10。 了 解 这 种 电路 的 行为 后 ， 可 以 用 真 
值 表 形式 化 这 种 行为 。 需 要 指定 两 个 输出 ， 不 
只 是 一 个 ， 因 为 需要 有 一 个 求 和 和 一 个 进位 。 
半 加 器 的 真 值 表 如 表 3-9 所 示 。 

仔细 观察 会 发 现 ， 求 和 实际 上 是 一 个 异 或 
运算 。 进 位 输出 相当 于 一 个 与 门 。 可 以 将 一 个 
异 或 门 和 一 个 与 门 进行 组 合 ， 从 而 生成 图 3-11 
所 示 的 半 加 器 的 逻辑 图 。 a 

半 加 右 电 路 是 一 个 非常 简单 的 电路 ,但 不 
是 很 有 用 ， 因 为 它 只 能 加 两 位 。 然 而 ， 可 以 将 
这 样 的 加 法 器 电路 进行 延伸 以 允许 更 大 的 二 进 




















制 数字 进行 加 法 。 想 想 你 是 如 何 执行 十 进 制 加 进位 
法 运算 的 : 你 从 最 右边 的 列 开始 相 加 并 注意 单 图 3-11 半 加 器 的 逻辑 图 
位 数字 ， 然 后 向 十 位 进位 。 再 然后 继续 以 类 似 


方式 进行 到 当前 列 。 可 以 用 相同 的 方式 相 加 三 进 制 数 。 需 要 有 一 个 三 个 输入 (x、y 和 进位 ) 的 
电路 和 两 个 输出 (总 和 及 进位 )。 图 3-12 显示 了 一 个 全 加 器 的 真 值 表 和 相应 的 逻辑 图 。 请 注意 ， 
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全 加 需 是 由 两 个 半 加 融和 一 个 或 门 组 成 的 。 
进位 位 输入 


生 








进位 位 输出 





a ) 全 加 器 的 真 值 表 b ) 全 加 器 的 逻辑 图 
图 3-12 


你 可 能 想 知道 这 种 全 加 器 电路 是 如 何 进行 二 进 制 数 相 加 的 ? 它 能 够 执行 只 有 三 位 数 的 加 法 
吗 ? 答案 是 ， 它 不 能 。 然 而 ， 可 以 建立 能 够 相 加 两 个 16 位 字 的 加 法 器 ， 通 过 复制 16 次 上 述 电 
路 ， 并 且 提 供 一 个 进位 电路 给 电路 左边 的 进位 。 图 3-13 说 明了 这 一 过 程 。 因 为 在 加 法 器 中 进 
位 是 以 “ 行 波 ”的 顺序 生成 ， 这 种 类 型 的 电路 被 称 为 行 波 进位 加 法 器 。 注 意 ， 不 用 绘制 所 有 
的 逻辑 门 来 构成 一 个 全 加 器 ， 可 采用 黑 盒 来 描绘 加 法 器 。 使 用 黑 盒 的 方法 可 以 忽略 实际 门 电路 
的 细节 ， 只 需 关注 电路 的 输入 和 输出 。 你 将 很 快 看 到 这 通常 是 与 大 多 数 电路 包括 译 码 器 、 多 路 
复 用 器 、 加 法 器 相关 的 。 


Ys Xs 7 XX i 加 0 
ya C. SS (Gs 
7 -mks 
5, 5 So 


图 3-13 行 波 进位 加 法 器 的 逻辑 图 


因为 这 个 加 法 器 动作 很 慢 ， 所 以 不 能 正常 实现 。 但 是 它 容 易 理 解 ， 对 于 更 多 位 数 的 二 进 制 
数 加 法 的 实现 它 也 能 提供 给 你 一 些 想法 。 对 于 加 法 器 设计 进行 修改 产生 了 先行 进位 加 法 咒 、 进 
位 选择 加 法 器 和 进位 保存 加 法 器 以 及 其 他 一 些 形式 。 每 个 方法 都 试图 缩短 两 个 二 进 制 数 执行 加 
法 时 的 延迟 。 事 实 上 ， 这 些 新 的 加 法 器 通过 并 行 地 执行 加 法 和 减少 最 大 进位 路 径 ， 比 行 波 进位 
加 法 器 的 速度 要 快 40% ~90% 。 加 法 器 是 非常 重要 的 电路 ， 计 算 机 如 果 不 能 做 加 法 将 会 是 非常 
无 用 的 。 

所 有 计算 机 经 常 使 用 的 一 个 同样 重要 的 操作 是 从 一 组 个 二 进 制 输入 译 码 为 最 大 2" 个 输出 。 
译 码 器 使 用 这 些 输 入 和 它们 各 自 的 值 以 选择 一 个 特定 的 输出 行 。 什 么 是 “选择 输出 行 ” 呢 ? 它 只 
是 意味 着 一 个 独 有 的 输出 行 被 声明 或 设置 为 1， 而 其 他 输出 行 被 设置 为 0。 译 码 器 通常 由 输入 的 
数量 和 输出 的 数量 来 定义 。 例 如 ,具有 3 个 输入 和 8 个 输出 的 译 码 器 称 为 3-8 译 码 器 。 

我 们 提 到 过 译 码 器 是 计算 机 中 最 常见 的 组 件 。 你 也 许 能 够 叫 出 计算 机 中 很 多 运算 操作 的 名 
称 ， 但 你 会 发 现 很 难 找到 一 个 译 码 电路 的 例子 。 这 是 因为 ， 你 对 计算 机 的 访 存 过 程 还 不 是 很 熟悉 。 

在 计算 机 中 ， 所 有 的 存储 器 地 址 都 是 一 个 二 进 制 数 。 当 对 存储 器 进行 访问 时 (无 论 是 读 取 
还 是 写 和 人) ， 首 先 必 须 确定 的 是 实际 的 地 址 。 这 就 是 通过 译 码 器 完成 的 。 例 3. 13 将 解释 译 码 器 
如 何 工 作 和 它 可 能 被 用 于 什么 地 方 。 
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3-8 译 码 器 电路 

假设 内 存 由 8 个 芯片 组 成 ， 每 个 包含 8K 字 节 。 假 设 芯 片 0 包含 存储 器 地 址 0 ~ 8191( 或 
以 十 六 进 制 表示 为 1FFF) ， 芯 片 1 包含 存储 器 地 址 8192 ~ 16 383 (或 以 十 六 进 制 表示 为 2000 ~ 
3FFF) ， 等 等 。 假 设 总 共有 8K x8( =64K(65 536) ) 地 址 ， 不 必用 二 进 制 数 记 下 所 有 64K 个 地 
址 ; 然而 ， 以 二 进 制 形 式 写 出 一 些 地 址 (如 在 以 下 段落 中 说 明 的 ) 将 说 明 为 什么 译 码 器 是 必 
需 的 。 

已 知 64 =2 和 1K=2"”， 那 么 64K =2" x2”=2"， 这 表示 需要 16 位 来 表示 每 个 地 址 。 如 果 
读者 无 法 理解 这 一 点 ， 请 从 较 小 的 地 址 开始 。 例 如 ， 如 果 你 有 4 个 地 址 一 一 地 址 0、1、2 和 3， 
等 效 的 二 进 制 地 址 是 00、01、10 和 11， 它 们 需要 两 位 来 表示 ， 因 为 2 =4。 现 在 假设 有 8 个 地 
址 ， 则 必须 使 用 二 进 制 计数 0 ~7。 这 需要 多 少 位 ? 答案 是 3。 你 可 以 把 它们 都 写 下 来 ， 或 者 直 
接 想到 8 =2 。 上 述 例 子 说 明 表示 地 址 所 需 的 最 小 位 数 是 指数 。( 我 们 将 在 本 章 后 面 以 及 第 4 章 
和 第 6 章 再 阐述 这 个 想法 ,) 

芯片 0 上 的 所 有 地 址 格式 为 : 000 xxxxxxxxxxxxx。 因 为 芯片 0 包含 的 地 址 为 0 ~ 
8191 ， 这 些 地 址 的 二 进 制 表示 范围 是 0000000000000000 ~ 0001111111111111。 类 似 地 ， 芯 片 1 
的 所 有 地 址 具有 格式 001 xxxxxxxxxxxxx ， 依 此 类 推 其 余人 芯片。 最 左边 的 3 位 确定 地 址 实 
际 位 于 哪个 芯片 上 。 需 要 16 位 来 表示 整个 地 址 , 但 是 在 每 个 芯片 上 ,只 有 2" 个 地 址 。 因 此 ， 
只 需要 13 位 来 唯一 地 标识 给 定 芯片 上 的 地 址 。 最 右边 的 13 位 给 出 了 这 个 信息 。 

给 定 一 个 地 址 时 ， 计 算 机 必须 首先 确定 使 用 哪个 芯片 ， 然 后 必须 找到 该 特定 芯片 上 的 实际 
地 址 。 在 示例 中 ， 计 算 机 将 使 用 最 左边 的 3 位 来 挑选 芯片 ， 然 后 使 用 剩余 的 13 位 在 芯片 上 面 
找到 地 址 。 这 3 个 高 位 实际 上 作为 到 译 码 器 的 输入 ， 使 得 计算 机 可 以 确定 激活 哪个 世 片 用 于 读 
取 或 写 入 。 如 果 前 3 位 为 000， 则 应 激活 芯片 0。 如果 前 3 位 是 111， 则 应 当 激活 芯片 7。 如 果 
前 3 位 是 010 会 激活 哪个 芯片 ? 它 将 是 芯片 2。 选中 特定 的 线 去 激活 芯片 。 译 码 器 的 输出 用 于 
激活 一 个 且 仅 一 个 芯片 作为 被 译 码 的 地 址 。 < 

图 3-14 说 明了 表示 译 码 器 的 物理 组 件 和 符号 。 我 们 将 在 3.6 节 中 看 到 如 何在 内 存 中 使 用 译 





1 个 输入 : : 2" 个 输出 





a ) 译 码 器 的 内 部 组 件 b ) 译 码 器 的 符号 
图 3-14 


男 一 个 常见 的 组 合 电 路 是 多 路 复 用 器 。 该 电路 选择 许多 输入 线 中 的 一 个 二 进 制 信息 ， 并 将 
其 引导 到 单个 输出 线 。 特 定 输 入 线 的 选择 由 一 组 选择 变量 或 控制 线 控制 。 在 任何 给 定时 间 ， 从 
电路 到 输出 线 只 有 一 个 输入 路 由 (被 选中 的 ) 。 所 有 其 他 输入 均 为 “切断 ”状态 。 如 果 控 制 线 
上 的 值 发 生 了 改变 ， 则 输入 也 会 改变 。 图 3-15 展示 了 多 路 复 用 器 中 的 物理 组 件 和 符号 。S 和 
5, 是 控制 线 ,， ~ 是 输入 值 。 
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一 个 输入 被 
连接 到 输出 


| So 
控制 线 





a ) 多 路 复 用 器 的 内 部 组 件 b ) 多 路 复 用 器 的 符号 
图 3-15 


另 一 组 有 用 的 组 合 电路 包括 奇偶 校 验 发 生 器 和 奇偶 校 验 检 查 器 (在 第 2 章 中 研究 过 奇偶 校 
验 ) 。 奇 偶 校 验 发 生 器 是 创建 必要 的 奇偶 校 验 位 以 使 一 个 字 相 加 的 电路 ; 奇偶 校 验 检 查 器 确保 
字 中 存在 正确 的 奇偶 校 验 (奇数 或 偶数 ) ， 如 果 奇 偶 校 验 位 不 正确 ， 则 检测 到 错误 。 

通常 ， 奇 偶 校 验 发 生 器 和 奇偶 校 验 检 查 器 使 用 XOR 函数 来 构造 。 假 设 使 用 奇 校 验 ， 表 3-10 
给 出 了 有 3 位 数 的 奇偶 校 验 发 生 器 的 真 值 表 。 具 有 3 个 信息 位 和 1 个 奇偶 校 验 位 的 4 位 字 的 奇 
偶 校 验 检查 器 的 真 值 表 如 表 3-11 所 示 。 如 果 检 测 到 错误 ， 则 奇偶 校 验 检 查 器 输出 1， 否则 输出 
0。 把 它 作为 一 个 练习 ， 请 画 出 奇偶 校 验 发 生 堪 和 奇偶 校 验 检 查 吉 相应 的 逻辑 图 。 


表 3-10 奇偶 校 验 发 生 器 





























x % ” 奇偶 校 验 位 
0 0 0 1 
0 0 1 0 
0 1 0 0 
0 1 1 1 
1 0 0 0 
1 0 1 1 
1 1 0 1 
1 1 1 0 
表 3-11 奇偶 校 验 检查 器 
X ) z | 检测 到 错误 ? 
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位 移 可 将 字 或 字 节 的 位 向 左 或 向 右 移动 一 个 位 置 ， 是 一 个 非常 有 用 的 操作 。 向 左 移动 一 位 使 
它 的 指数 增加 一 位 。 当 无 符号 整数 的 位 向 左 移 一 位 时 ， 具 有 与 该 整数 乘 以 2 相同 的 效果 ,但 是 能 
使 用 更 少 的 机 器 周期 来 完成 。 向 左 或 右 移 位 (分 别 ) 后 最 左 或 最 右 位 会 丢失 。 左 移 1101 会 得 到 


1010， 右 移 则 变 成 0110。 一 些 缓冲 器 和 编码 器 依 
赖 移 位 器 从 一 个 字 节 变 成 一 个 位 流 ， 使 每 个 位 都 
可 以 在 序列 中 被 处 理 。4 位 移 位 器 如 图 3-16 所 
示 。 当 控制 线 $ 为 低 ( 即 为 0) 时 ， 输 入 的 每 个 位 
(标记 为 到) 都 向 左 移 动 一 位 到 输出 (标记 为 
0u 到 0;) 。 当 控制 线 为 高 电 平时 ， 发 生 右 移 。 这 
个 移 位 器 可 以 很 容易 地 扩展 到 任意 数量 的 位 ， 结 
合 存储 器 组 件 可 以 创建 出 移 位 寄存 器 。 

在 这 个 简短 的 小 节 中 ， 不 能 介绍 所 有 的 组 合 
电路 。 本 章 结尾 的 参考 文献 提供 了 更 多 关于 组 合 
电路 的 信息 。 然 而 ， 在 完成 组 合 逻辑 之 前 ， 还 有 
一 个 需要 介绍 的 组 合 电 路 一 一 ALU。 前 面 已 经 介 
绍 了 构建 算术 逻辑 单元 (ALU) 所 需 的 所 有 组 件 。 

图 3-17 给 出 了 一 个 具有 4 个 基本 操作 (AND、 
OR、NOT 和 加 法 ) 的 简单 ALU: 每 个 运算 都 在 2 


S 





0; 0 O, 0 


图 3-16 4 位 移 位 器 


位 字 的 机 器 上 执行 。 控 制 线 有 和 fi 确定 CPU 执行 哪 种 操作 。 信 号 00 代表 加 法 (A +B)，01 代表 
NOT A，10 代表 A OR B，11 代表 A AND B。 输入 线 4。 和 4, 表示 一 个 字 的 两 位 ，B 和 B, 表示 第 


二 个 字 。C 和 C, 代表 输出 线 。 





图 3-17 简单 的 两 位 ALU 
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3.6 时序 电 路 

在 上 一 节 中 重点 研究 了 组 合 逻 辑 。 已 经 研究 过 通过 检验 变量 ， 以 及 变量 与 变量 之 间 的 关系 
来 输出 布尔 函数 ， 以 及 仅 依赖 于 输入 值 的 输出 函数 。 如 果 改 变 一 个 输入 值 ， 这 会 直接 对 输出 值 
产生 影响 。 组 合 电路 的 主要 缺点 是 没有 存储 的 概念 (它们 是 无 记忆 的 ) ， 这 就 会 带 来 问题 。 计 
算 机 必须 有 一 种 记忆 数值 的 方法 。 考 虑 一 个 更 简单 的 汽水 机 所 需 的 数字 电路 。 当 你 把 钱 放 进 汽 
水 机 后 ， 机 器 在 任何 给 定 的 时 刻 会 记得 你 放 了 多 少 钱 。 如 果 没 有 这 种 能 力 ， 这 将 是 非常 难以 使 
用 的 。 不 能 使 用 组 合 电 路 来 构建 汽水 机 。 为 了 了解 汽水 机 的 工作 原理 ， 并 最 终了 解 计算 机 如 何 
工作 ， 必 须 学 习 时 序 逻 辑 。 


3.6.1 基本 概念 

时 序 电路 定义 为 其 输出 是 由 当前 输入 和 先前 的 输入 一 起 决定 的 。 因 此 ,输出 取决 于 过 去 的 
输入 。 要 想 记 住 以 前 的 输入 ， 时 序 电 路 必须 有 某 种 形式 的 存储 组 件 。 通 常 将 该 存储 元 件 称 为 触 
发 器 。 这 个 触发 器 的 状态 是 先前 输入 的 函数 。 因 此 ， 输 出 取决 于 对 当前 输入 和 电路 的 现在 状 
态 。 组 合 电路 是 由 门 电路 生成 的 ， 时 序 电路 是 由 触发 器 生成 的 。 


3. 6.2 时钟 

在 讨论 时 序 逻 辑 之 前 ， 必 须 首先 介绍 一 种 排序 事件 的 方法 。( 时 序 电路 使 用 过 去 的 输入 来 
确定 当前 输出 的 事实 表示 必须 有 事件 排序 。) 一些 时 序 电 路 是 异步 的 ， 这 意味 着 当 输入 值 发 生变 
化 时 ， 它 们 就 会 变 得 活跃 起 来 。 同 步 时 序 电 路 使 用 时 钟 来 对 事件 进行 排序 。 时 钟 是 发 出 一 系列 
脉冲 的 电路 ， 这 个 电路 在 连续 脉冲 之 间 具有 精确 脉冲 宽度 和 精确 间隔 。 这 个 间隔 称 为 时 钟 周 期 
时 间 。 时 钟 速度 通常 以 兆赫 效 或 千 兆赫 效 来 测量 。 

时 序 电 路 使 用 时 钟 决定 何 时 更 新 电路 状态 ( 即 “现在 ”的 输入 何 时 变 为 “过 去 ”的 输入 ) 。 
这 意味 着 电路 的 输入 只 能 在 给 定 的 离散 时 间 下 影响 存储 组 件 。 在 本 章 中 ,我 们 研究 同步 时 序 电 
路 ， 因 为 它们 比 异步 时 序 电路 更 容易 理解 。 因 此 ， 当 提 到 “时 序 电 路 ”时 ， 就 同 义 于 “同步 
时 序 电 路 ”。 大 多 数 时 序 电路 是 边沿 触发 (与 电 平 触发 相反 ) 的 。 这 意味 着 它们 可 以 在 时 钟 信 号 
的 上 升 沿 或 下 降 沿 改变 状态 ， 如 图 3-18 所 示 。 


> 二- 
上 升 沿 下 降 沿 低 


各 吉 二 本 而 而 硬 败 男 


图 3-18 表示 离散 时 间 的 时 钟 信号 


3. 6.3 触发 器 

电 平 触发 电路 不 论 在 时 钟 信号 为 高 还 是 低 时 都 可 以 改变 状态 。 许 多 人 互 换 使 用 术语 锁 存 和 
触发 器 。 在 技术 上 ， 锁 存 器 是 电 平 触 发 ， 而 触发 器 是 边沿 触发 。 在 本 书 中 ， 使 用 术语 触发 器 。 
威廉 . 埃 克 尔 斯 和 F. W. 乔丹 在 1918 年 发 明了 第 一 个 触发 器 (用 真空 管 ) ， 所 以 这 些 电 路 都 已 
经 使 用 一 段 时 间 了 。 然 而 ， 它 们 并 不 总 是 被 称 为 触发 器 。 像 许多 其 他 发 明 一 样 ， 它 们 最 初 是 以 
发 明 人 命名 的 ， 称 为 埃 克 尔 斯 - 乔丹 触发 电路 。 那 么 “触发 器 ”的 名 字 是 从 哪里 来 的 ” 有 人 
说 是 因为 触发 时 电路 产生 的 声音 (如 同 扬声器 连接 到 原 电路 的 一 个 元 件 时 产生 的 声音 ) ;其 他 
人 认为 它 来 自 于 电路 从 一 个 状态 翻转 到 另 一 个 以 及 翻转 回来 的 能 力 。 

为 了 “ 记 住 ” 过 去 的 状态 ， 时 序 电 路 依赖 于 一 个 称 为 反馈 的 概念 。 简 单 来 说 ， 这 意味 着 
电路 的 输出 被 反馈 作为 这 个 电路 的 输入 。 一 个 非常 简单 的 反馈 电路 使 用 两 个 非 门 ， 如 图 3-19 
所 示 。 在 该 图 中 ， 如 果 @ 为 0， 则 它 将 始终 为 0。 如 果 @ 为 1， 它 将 始终 为 1。 这 不 是 一 个 非常 
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有 趣 或 有 用 的 电路 ， 但 它 能 让 你 看 到 反馈 是 如 何 工作 的 。 
更 有 用 的 反馈 电路 是 由 两 个 或 非 门 组 成 的 最 基本 的 存储 组 件 ， 称 为 SR 触发 器 。SR 代表 
“设置 /复位 ”，SR 触发 器 的 逻辑 图 如 图 3-20 所 示 。 





图 3-19 简单 反馈 电路 图 3-20 SR 触发 器 的 逻辑 图 
可 以 通过 特性 表 来 描述 任何 触发 器 ， 它 表示 基于 输入 和 当前 状态 0 下 一 个 状态 应 该 是 什 
么 ， 符 号 Q(1) 表 示 当 前 状态 ，Q(t+1) 表 示 下 一 状态 或 者 在 时 钟 脉冲 之 后 触发 右 应 该 进入 的 状 
态 。 可 以 用 时 序 图 指示 时 钟 的 改变 与 触发 器 输出 之 间 的 信号 关系 。 图 3-21a 显示 了 SR 时 序 电 
路 的 实际 实现 ; 图 3-21b 所 示 为 向 触发 器 添加 一 个 时 钟 ; 图 3-21c 指定 了 其 特性 表 ; 图 3-21d 
显示 了 一 个 时 序 图 。 这 里 ， 仅 介绍 时 钟 触发 器 。 


区 
S 0 
时 钟 
0 
R 2 R 





a ) SR 触发 器 b ) 带 时 钟 的 SR 触发 器 
可 
| 0 0 | ew (不 改变 ) Ro 
jo 1 | owo) 
| | | 人 
虹 遇 i 时 钟 

发 小 bh t 

c ) SR 触发 器 的 特性 表 d) SR 触发 器 的 时 序 图 ( 假设 0 的 初始 值 为 0 ) 
图 3-21 


SR 触发 器 会 表现 出 有 趣 的 行为 。 它 有 3 个 输入 : S、R 和 当前 输出 Q(t)。 创 建 表 3-12 所 
示 的 真 值 表 ， 以 进一步 说 明 此 电路 的 工作 原理 。 


表 3-12 SR 触发 器 的 真 值 表 























Ss R 当前 状态 Q( 4) | 下 一 个 状态 Q(t+1) 
0 0 0 0 

0 0 1 1 

0 1 0 0 

0 1 1 0 

1 0 0 1 

1 0 1 1 

1 1 0 未 定义 

1 1 1 未 定义 








例如 ， 如 果 5 为 0 且 R 为 0， 并 且 当 前 状态 0(1) 为 0， 则 下 一 状态 Q(t+1) 也 为 0; 如 果 
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为 0 且 R 为 0, 并 且 0(1) 为 1!， 则 Q(t+1) 被 置 位 为 1。 实 际 上 在 时 钟 脉冲 下 当 (S，R) 为 
(0，0) 的 输入 时 结果 不 会 改变 。 根 据 类 似 的 论证 ， 可 以 看 到 输入 ($, R) 为 (0, 1) 时 下 一 个 状 
态 Q(t+1) 强 制 设置 为 0， 而 不 管 当 前 状态 如 何 ( 即 在 电路 输出 进行 强制 复位 )。 当 (5S, R) = 
(1, 0) 时 ， 电 路 输出 置 位 为 1。 

看 看 图 3-21d 所 示 的 时 序 图 ,在 与 时 刻 时 钟 脉冲 到 来 ， 此 时 S$S=R=0, 0 不 变 。 在 4 时 
刻 ，5 变 为 1，R 仍 为 0， 因 此 当时 钟 脉冲 到 来 时 ，0Q 置 位 为 1。 在 4 时刻, S=R=0， 因 此 0 
不 变 。 在 时刻， 因为 R 变 为 1!， 所 以 在 时 钟 脉冲 到 来 时 ，S =0，R =1，0Q 复位 为 0。 

这 个 特定 的 触发 器 很 奇怪 。 如 果 尺 和 3 都 同时 置 位 为 1 会 如 何 呢 ? 如 果 检 查 图 3-21a 所 示 
的 未 计时 的 触发 器 ， 这 会 得 到 一 个 最 终 状态 ，@ 和 0' 都 为 0, 但 是 如 何 能 使 得 Q =0 = 0'? 来 看 
看 图 3-21b 所 示 的 已 定时 触发 吉 ， 当 $= 民 =1 时 会 发 生 什 么 。 当 时 钟 脉冲 到 达 时 ，S 和 R 的 值 
输入 到 触发 器 中 。 这 使 得 0 和 0Q0' 都 为 0。 当 去 除 时 钟 脉冲 时 ， 不 能 确定 触发 器 的 最 终 状态 ， 因 
为 一 旦 时 钟 脉冲 结束 ，S 和 的 输入 都 会 消失 ， 并且 所 产生 的 状态 取决 于 哪 一 个 输入 首先 终止 
(这 种 情况 通常 称 为 “竞争 条 件 ”) 。 因 此 , 在 SR 触发 器 中 不 允许 有 这 种 输入 组 合 。 

可 以 添加 一 些 逻 辑 条 件 到 SR 触发 器 以 确保 非法 状态 永远 不 会 出 现 一 一 只 需 修改 SR 触发 
器 ， 如 图 3-22 所 示 。 这 生成 了 下 触发 器 。 正 触发 融和 SR 触发 器 基本 相同 ， 除 了 当 两 个 输入 
为 1 时 ， 该 电路 取消 当前 状态 。 图 3-22d 所 示 的 时 序 图 说 明了 此 电路 的 工作 原理 。 在 t 时 刻 ， 
/=K=0， 导 致 0 没有 变化 。 在 已 时刻， J=1 和 K=0， 因 此 0 和 置 位 为 1。 在 4 时刻, K=J=1， 
这 会 导致 0 取 反 ,将 其 从 1 变 为 0。 在 时刻, K=0 和 J=1， 强制 Q 置 位 为 1。 


Q(D) (不 改变 ) 


立 
1 ( 置 位 为 1 ) 


b ) 下 触发 器 的 特性 表 
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可 
于 


1 交 E 


c) 的 触发 器 作为 一 个 改进 的 SR 触发 器 d) 本 触发 器 的 时 序 图 ( 假设 0 的 初始 值 为 0 ) 


图 3-22 


关于 “JJ” 的 来 源 似 乎 存在 很 大 的 分 歧 。 有 些 人 认为 它 是 以 集成 电路 的 发 明 者 杰克 基 
尔 比 (Jack Kilby ) 命名 的 。 有 些 人 认为 它 是 以 约翰 卡尔 达 什 (John Kardash ) 命名 的 ， 人 们 经 常 
认为 他 是 下 触发 器 的 发 明 人 (如 他 在 当前 公司 网 站 上 的 个 人 简历 中 所 述 ) 。 还 有 一 些 人 认为 这 
是 由 休 斯 飞机 公司 的 工人 创造 的 ， 他 们 用 输入 字母 标记 电路 输入 ，J 和 天 恰好 是 列表 中 的 下 一 
个 (如 在 1968 年 提交 给 电子 杂志 《EDN》 的 详细 信件 ) 。 

SR 触发 器 的 男 一 种 变形 是 D( 数据) 触发 器 。D 和 触发 器 是 计算 机 物理 内 存 的 真实 表示 。 该 
时 序 电 路 可 以 存储 一 位 信息 。 如 果 在 输入 线 D 上 设置 为 1， 在 时 钟 脉冲 到 来 时 ， 输 出线 0 变 为 
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1; 如 果 在 输入 线 上 设置 为 0， 在 时 钟 脉冲 到 来 时 ， 输 出 变 为 0。 记 住 输出 0 表示 电路 的 当前 状 
态 。 因 此 ， 输 出 值 为 1 表示 电路 当前 “存储 ” 值 为 1。 图 3-23 所 示 为 D 触发 器 ， 列 出 了 它 的 特 


性 表 和 时 序 图 ,并且 揭 示 了 D 触发 器 实际 上 是 SR 触发 吉 的 变形 。 


本 区 FT 











i 1 


c ) D 触 发 器 作为 改进 的 SR 触发 器 d ) D 触 发 器 的 时 序 图 


图 3-23 


3. 6.4 有 限 状态 机 


特性 表 和 时 序 图 可 用 来 描述 触发 器 和 时 序 电 路 的 动作 。 有 限 状态 机 (FSM) 提供 了 等 效 的 图 
形 描 述 。 有 限 状 态 机 通常 使 用 圆圈 表示 机 器 状态 ， 用 有 向 弧 表 示 从 一 个 状态 转变 到 男 一 个 。 每 
个 圆圈 都 标 有 它 代 表 的 状态 ， 每 个 圆 弧 都 标记 有 用 于 该 状态 转换 的 输入 或 输出 。FSM 一 次 只 能 


处 于 一 个 状态 。 这 里 只 对 同步 FSM 进行 研究 (只 有 当时 钟 到 来 
时 才 允 许 转换 状态 ) 。 

可 以 用 状态 机 建 模 的 真实 示例 是 公共 交通 灯 。 它 有 3 种 状 
态 : 绿色 、 黄 色 和 红色 。 当 硬件 中 的 计时 需 到 达 时 状态 发 生 转 
换 。 下 面 是 交通 灯 的 FSM。 

有 许多 种 不 同类 型 的 有 限 状 态 机 ， 每 种 都 有 不 同 的 作用 。 
图 3-24 显示 了 一 个 正 触发 器 的 摩尔 机 表示 。 圆 圈 代 表 触 发 器 的 
两 种 状态 ， 标 记 为 4 和 B。 输出 8 用 括号 表示 ， 圆 弧 表 示 状 态 
之 间 的 转换 。 可 以 在 这 个 图 中 看 到 ， 当 J=1 和 天 =0 或 J=K=1 
时 ,JK 触发 器 从 状态 0 变 到 状态 1; 当 J=K=1 或 1=0 和 K=1 
时 ， 它 从 状态 1 变 为 状态 0。 这 种 有 限 状 态 机 是 摩尔 型 机 器 ， 因 


为 每 个 状态 与 机 器 的 输出 相关 。 事 实 上 ， 图 中 所 示 的 反射 电弧 是 不 需要 的 ， 因 为 机 器 的 输出 仅 在 
状态 改变 时 改变 并且 状 态 不 通过 反射 电弧 改变 。 据 此 ， 可 以 绘制 一 个 简化 的 摩尔 机 (如 图 3-25 
所 示 )。 摩 尔 机 以 爱德华 . F. 摩尔 命名 ， 他 于 1956 年 发 明了 这 种 类 型 的 FSM。 
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图 3-24 用 下 触发 器 表示 摩尔 机 图 3-25 用 下 触发 器 表示 简化 的 摩尔 机 
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与 爱德华 摩尔 同时 代 的 乔治 H. 米 莉 独立 发 明了 男 一 种 类 型 的 FSM， 它 也 是 以 发 明 者 命 
名 的 。 像 摩尔 机 一 样 ， 米 莉 机 也 是 用 圆圈 表示 状态 ， 用 连接 弧 表示 每 个 状态 过 渡 。 与 摩尔 机 不 
同 的 是 ， 米 莉 机 的 输出 不 但 与 每 个 状态 相关 ( 在 摩尔 机 示例 中 将 0 或 1 放 在 方 括号 中 ) ， 还 与 每 
个 转换 相关 。 这 意味 着 米 莉 机 的 输出 函数 oooolm 


10/1,00/1 
与 当前 状态 及 其 输入 有 关 ， 而 摩尔 机 的 输 ee 
出 函数 仅 与 当前 状态 有 关 。 每 个 过 渡 弧 上 : 


用 其 输入 和 输出 分 开标 记 并 用 斜 杠 隔 开 。 
反射 弧 不 能 从 米 莉 机 中 删除 ， 因 为 它们 描 


绘 机 器 的 输出 。 图 3-26 显示 了 一 个 用 于 
JK 触发 需 的 米 莉 机 。 QU 
在 实际 执行 摩尔 机 或 米 莉 机 时 ， 有 两 图 3-26 用 下 触发 器 表示 一 个 米 莉 机 
件 事情 是 必须 要 做 的 : 用 于 存储 当前 状态 
的 存储 需 ( 寄存 融 ) ， 以 及 控制 输出 和 从 一 个 状态 到 另 一 个 状态 转换 的 组 合 逻 辑 组 件 。 图 3-27 
说 明了 这 两 个 机 器 的 逻辑 。 










( 存储 器 ) 





a ) 摩尔 机 框图 


a 时 序 钦 辑 


( 存储 器 ) 





b ) 米 莉 机 框图 
图 3-27 


这 里 提供 的 摩尔 机 或 米 莉 机 的 图 形 模型 和 框图 对 于 电路 行为 的 高 级 概念 建 模 是 很 有 用 的 。 
然而 ， 一 旦 电路 变 得 很 复杂 时 ， 摩 尔 机 和 米 莉 机 会 变 得 很 麻烦 ， 并 且 很 难 捕获 到 实现 所 需 的 细 
节 。 例 如 ， 考虑 一 个 微波 炉 。 微 波 炉 将 仅 在 门 关闭 时 才 处 于 “ 开 ” 状 态 ， 控 制 转盘 设置 为 
“ 豪 饪 ”或 “ 除 箱 ”， 定 时 器 开始 显示 时 间 。“ 开 ”状态 意味 着 磁 控 管 正 在 产生 微波 ， 炉 室 中 的 
灯 被 点 亮 ， 并 且 转 盘 正 在 旋转 。 如 果 时 间 到 了 ， 打 开门 ， 或 控制 从 “ 亮 饪 ” 变 为 “关闭 ”时 ， 
微波 炉 变 为 “ 关 ” 状 态 。 由 定时 器 提供 的 范围 连同 定义 一 个 状态 的 大 量 信号 ， 很 难 在 摩尔 机 
和 米 莉 机 中 捕获 。 因 此 ， 克 里 斯 托 弗 . R. 克莱尔 发 明了 算法 状态 机 (ASM) 。 正 如 其 名 称 所 示 ， 
算法 状态 机 表示 将 FSM 从 一 个 状态 提前 到 另 一 个 状态 的 算法 。 

算法 状态 机 由 包含 状态 框 、 标 签 、 可 选 条 件 和 输出 框 的 块 组 成 ( 见 图 3-28 ) 。 每 个 ASM 块 
恰好 具有 一 个 人 口 点 和 至 少 一 个 出 口 点 。 摩 尔 型 输出 (电路 信和 号) 在 状态 块 内 指示 ， 米 莉 型 输 
出 在 椭圆 输出 “ 盒 ” 中 指示 。 如 果 信 号 在 “高 ”时 置 位 ， 则 前 组 为 H; 否则 ， 它 将 以 工 为 前 
级。 如 果 信 号 立即 置 位 ， 则 它 也 以 1 为 前 级。 否则 ， 在 下 一 个 时 钟 周期 信号 有 效 。 导 致 状态 变 
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化 的 输入 条 件 ( 这 是 算法 部 分 ) 由 名 为 条 件 框 的 细 长 的 六 边 形 来 表示 。 任 何 数量 的 条 件 框 都 可 
以 放 在 ASM 块 内 ,并 且 它 们 的 显示 顺序 并 不 重要 。 在 示例 中 微波 炉 的 ASM 块 如 图 3-29 所 示 。 







退出 到 下 一 个 块 


微波 炉 
打开 


时 间 等 于 0、 门 打开 
或 开关 关闭 


开关 指向 毫 饪 或 除 箱 


图 3-29 微波炉 的 算法 状态 机 


可 见 ，ASM 可 以 表示 摩尔 机 和 米 莉 机 的 行为 。 摩 尔 机 和 米 莉 机 可 能 是 等 效 的 ， 因 此 可 以 
互 换 使 用 。 但是， 具体 使 用 哪 一 种 取决 于 实际 应 用 。 在 大 多 数 情 况 下 ， 摩 尔 机 相 比 米 莉 机 需要 
更 多 的 状态 ( 内存), 但 可 以 得 到 更 简单 的 实现 ， 因 为 摩尔 机 的 转换 更 少 。 


无 硬件 的 机 器 


摩尔 机 和 米 莉 机 只 是 你 在 计算 机 科学 文章 中 直到 的 许多 不 同类 型 有 限 状态 机 中 的 两 种 。 理 
解 FSM 对 于 研究 编程 语言 、 编 译 器 、 计 算 理论 和 自动 机 理论 至 关 重 要 。 我 们 将 这 些 抽象 称 为 
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机 器 ， 因 为 机 器 是 一 组 响应 刺激 (事件 ) 的 设备 ， 这 些 刺 激 是 基于 先前 事件 的 历史 (当前 状态 ) 
生成 的 可 预测 响应 (动作 ) 。 其 中 最 重要 的 是 有 限 自动 机 ( DFA) 计算 模型 。 一 般 来 说 ， 在 DFA 
中 ，M 完全 由 五 元 组 描述 ， 即 MM=(Q，5，，6，F) ， 其 中 : 

。0 是 表示 机 器 能 承担 的 每 一 种 配置 的 有 限 状态 集合 ; 

。S 是 @ 的 元 素 , 表示 起 始 状态 ， 它 是 机 器 接收 任何 输入 之 前 的 初始 状态 ; 

。 卫 是 机 器 能 识别 的 输入 字母 表 或 事件 集 ; 

。 5 是 映射 @ 中 的 一 个 状态 和 输入 字母 表 中 的 一 个 字母 到 @ 中 另 一 个 (可 能 相同 ) 状态 的 

转换 函数 ; 

。 到 是 最 终 (或 接受 ) 状 态 的 一 组 状态 (@ 的 元 素 ) 。 

DFA 在 编程 语言 的 研究 中 特别 重要 ， 它 们 用 于 识别 语法 或 语言 。 要 想 使 用 DFA， 请 从 初始 
状态 开始 并 处 理 输入 字符 串 ， 一 次 一 个 字符 ， 随 着 输入 而 改变 状态 。 在 处 理 整个 字符 串 时 ， 如 
果 你 处 于 最 终 接受 状态 ， 则 DFA“ 接 受 ”该 合法 字符 串 。 和 否则， 字符 串 被 拒绝 。 

可 以 使 用 这 个 DFA 的 定义 来 描述 一 
个 机 器 ， 就 像 在 编译 器 中 从 源 代码 文件 中 
提取 变量 名 (字符 串 ) 一 样 。 假 设计 算 机 
语言 必须 接受 以 字母 开头 的 变量 名 ， 在 初 
始 字母 之 后 可 以 包含 无 限 字母 或 数字 流 ， 
并 由 空格 字符 ( 制 表 符 、 空 格 、 换 行 符 
等 ) 终 止 。 变 量 名 的 初始 状态 是 空 字符 
串 ， 因 为 没有 输入 被 读 取 。 在 右 图 中 用 夺 
张 的 箭头 (还 有 几 个 其 他 符号 ) 指示 这 个 
初始 状态 。 接收 一 个 变量 名 的 有 限 状 态 机 

当 机 器 识别 字母 字符 时 ， 它 转换 到 状 
态 1， 在 那里 只 要 输入 了 字母 或 数字 ， 它 就 会 保留 。 在 接收 到 空格 字符 时 ， 机 器 转换 到 状态 A， 
即 它 的 最 终 接受 状态 ， 用 双 图 指示 。 如 果 输 入 了 除数 字 、 字 母 或 空格 之 外 的 字符 ， 则 机 器 进入 
错误 状态 ， 这 是 拒绝 字符 串 的 最 终 状态 。 

我 们 更 感 兴趣 ( 因为 正在 讨论 硬件 ) 的 是 具有 输出 状态 的 摩尔 和 米 莉 FSM。 这 些 FSM 和 
DFA 之 间 的 基本 区 别 是， 除了 从 一 个 状态 转移 到 另 一 个 状态 的 转换 函数 以 外 ， 摩 尔 机 和 米 莉 机 
也 能 生成 一 个 输出 符号 。 此 外 ， 由 于 电路 没有 停止 或 接受 字符 囊 的 概念 ， 所 以 它们 没有 最 终 状 
态 集 的 定义 ， 而 是 直接 输出 。 摩 尔 机 和 米 莉 机 的 M 都 可 以 由 五 元 组 来 完全 描述 ， 即 M=(Q， 
Se 

。0 是 表示 机 器 每 个 配置 的 有 限 状态 集合 ; 

。 3 是 @ 的 元 素 ,表示 开始 状态 ， 即 机 器 在 接收 任何 输入 之 前 的 状态 ; 

。 允 是 机 器 可 以 识别 的 输入 字母 表 或 事件 集 ; 

e 厂 是 有 限 输 出 字母 表 ; 

。 5 是 将 状态 从 @ 和 输入 字母 表 的 字母 映射 到 @ 状态 的 转移 函数 。 

注意 ， 输 入 和 输出 字母 通常 是 相同 的 ， 但 不 是 必须 这 样 。 产 生 输 出 的 方式 是 区 分 摩尔 机 和 
米 莉 机 之 间 的 元 素 。 因 此 ， 摩 尔 机 的 输出 函数 府 入 了 S 的 定义 ， 米 痢 机 的 输出 函数 嵌入 了 转移 
函数 6。 

如 果 这 看 起 来 大 抽象 ， 那 么 只 要 记 住 一 台 计 算 机 可 以 被 认为 是 通用 有 限 状态 机 。 它 描述 为 
一 台 机 器 加 上 输入 以 及 产生 (通常 ) 的 预期 输出 。 有 限 状态 机 只 是 关于 计算 机 和 计算 的 另 一 种 
思考 方式 。 








3. 6.5 时 序 电路 示例 


锁 存 器 和 触发 器 可 以 实现 更 复杂 的 时 序 电路 。 因 此 寄存 器 、 计 数 器 、 存 储 器 和 移 位 寄存 器 
都 需要 使 用 存储 以 及 时 序 逻 辑 来 实现 。 

人 GE 时 序 电 路 的 第 一 个 例子 是 一 个 使 用 4 个 D 触发 器 组 成 的 简单 的 4 位 寄存 器 。( 要 
实现 存储 更 大 字 的 寄存 器 ， 需 要 添加 触发 器 。) 它 有 4 根 输入 线 、4 根 输出 线 和 1 根 时 钟 信号 线 。 
从 时 序 的 角度 来 看 ， 时 钟 是 非常 重要 的 ; 寄存 器 必须 全 部 接受 它们 的 新 输入 值 并 同时 改变 存储 
组 件 。 记 住 ， 同 步 时 序 电路 不 能 改变 状态 ， 除 非 在 时 钟 脉冲 到 来 时 。 相 同 的 时 钟 信号 绑 定 到 所 
有 4 个 D 触发 器 上 ， 因 此 它们 一 致 变化 。 图 3-30 描述 了 4 位 寄存 器 的 逻辑 图 ,以 及 该 寄存 器 
的 框图 。 在 实际 中 ,物理 组 件 具 有 电源 和 接地 等 附加 线路 ， 还 有 清除 线 ( 这 使 得 能 将 整个 寄存 
器 复位 为 全 0)。 然 而 ， 在 本 书 中 将 这 些 概 念 留 给 计算 机 工程 师 ， 我 们 关注 在 这 些 电路 中 存在 
的 实际 数字 逻辑 。 





Ino Out 
In Out 
In 寄存 器 Out 
时 钟 In; Out; 
TT 
a ) 4 位 寄存 器 b ) 4 位 寄存 器 的 框图 
图 3-30 本 


人 ES 另 一 个 有 用 的 时 序 电路 是 二 进 制 计 数 器 ， 时 钟 脉冲 到 来 时 它 会 产生 预定 的 状态 
序列 。 在 一 个 二 进 制 计 数 器 中 ， 这 些 状态 反映 了 二 进 制 数 序列 。 如 果 开 始 以 二 进 制 0000， 
0001，0010，0011，… 计 数 ， 则 可 以 看 到 数字 的 增加 ， 并 且 每 次 对 低位 进行 取 反 。 每 当 它 从 1 
到 0 改变 状态 时 ， 对 其 左边 的 位 求 反 。 当 每 个 其 他 位 从 0 到 1 改变 状态 时 ， 所 有 右边 的 位 等 于 
1。 对 于 取 反 的 概念 ， 二 进 制 计数 器 最 好 的 实现 是 使 用 下 触发 器 (回想 当 J 和 天 都 等 于 1 时， 
触发 器 取 反 当前 状态 ) 。 为 代替 每 个 触发 器 的 独立 输入 ， 有 一 个 在 每 个 触发 器 上 运行 的 计数 使 
能 线 。 当 时 钟 脉冲 到 达 时 电路 只 计数 并 且 此 计数 使 能 线 置 位 为 1。 如 果 计 数 使 能 被 设置 为 0， 
当时 钟 脉 冲 到 达 时 ， 电 路 不 改变 状态 。 非 常 仔细 地 检查 图 3-31， 用 各 种 输入 跟踪 电路 ， 以 确保 
你 理解 了 该 电路 如 何 输出 0000 ~ 1111 之 间 的 二 进 制 数 。 注 : B 、B, 、B, 和 B, 是 该 电路 的 输 
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出 ， 并 且 始 终 可 用 ， 而 与 计数 使 能 和 时 钟 信号 的 值 无 关 。 如 果 当 前 状态 为 1111 ， 并 且 时 钟 脉冲 
到 达 时 ， 则 检查 电路 进入 哪个 状态 。 





计数 使 能 


图 3-31 使 用 下 触发 名 的 4 位 同步 计数 器 本 


上 面 学 习 了 一 个 简单 的 寄存 器 和 一 个 二 进 制 计数 器 ， 现 在 我 们 已 准备 好 去 学 习 一 个 非常 简 
单 的 存储 电路 了 。 

(EB 图 3-32 所 示 的 存储 器 保存 4 个 3 位 字 ( 这 通常 表示 为 4 x3 的 存储 器 ) 。 电 路 
中 的 每 一 列表 示 一 个 3 位 字 。 注 意 ， 存 储 每 个 字 的 每 一 位 的 触发 器 是 通过 时 钟 信号 同步 的 ， 
因此 读 或 写 操作 总 是 读 或 写 一 个 完整 的 字 。In。、In, 和 In, 是 用 于 将 3 位 字 存 储 或 写 人 存储 
器 的 输入 线 。5。 和 5, 是 用 于 选择 存储 器 中 正在 引用 哪个 字 的 地 址 线 。( 注意 5, 和 5, 是 负责 
选择 正确 存储 字 的 2-4 译 码 器 的 输入 线 。) 从 存储 器 里 读 取 字 时 使 用 3 条 输出 线 (Out 、Out 
和 Out, ) 。 

应 该 注意 到 另 一 条 控制 线 一 一 写 使 能 控制 线 ， 它 表示 是 读 还 是 写 。 注 意 ， 在 这 个 芯片 中 ， 
为 了 便于 理解 ， 已 经 分 离 了 输入 和 输出 线 。 在 实际 中 ， 输 入 线 和 输出 线 是 相同 的 线 。 

对 这 个 存储 器 电路 的 讨论 进行 总 结 ， 以 下 是 将 一 个 字 写 入 到 存储 器 所 需 的 步骤 : 
. 在 $5, 和 5, 上 选中 地 址 。 
. 写 使 能 ( WE) 设置 为 高 。 
. 使 用 5, 和 5, 的 译 码 器 仅 使 能 一 个 与 门 ， 在 存储 器 中 选择 给 定 的 字 。 
. 在 步骤 3 中 选择 的 线 结合 时 钟 与 写 使 能 选择 一 个 字 。 
. 在 步骤 4 中 使 能 的 写 门 电路 驱动 所 选 字 的 时 钟 。 
. 当时 钟 脉 冲 到 来 时 ， 输 入 线 上 的 字 装 入 D 触发 器 上 。 | 

可 以 把 从 这 个 存储 器 读 取 一 个 字 以 创建 类 似 必要 步骤 的 列表 作为 一 个 练习 。 另 一 个 有 趣 的 
练习 是 分 析 这 个 电路 ， 并 确定 需要 什么 额外 的 组 件 来 扩展 存储 器 。 如 将 4 x3 存储 器 扩展 到 8 x 
3 存储 器 或 4 x8 存储 器 。 


小 人 上山 间 一 








图 3-32 4x3 内 存 


逻辑 门 的 实现 

在 本 章 介 绍 了 逻辑 门 。 但 在 这 些 门 里 面 到 底 发 生 了 什么 才 使 它 能 执行 次 辑 功 能 ? 这 些 门 实 
际 是 如 何 工作 的 呢 ? 现在 可 以 打开 盖子 并 观察 数字 逻辑 门 的 内 部 组 成 。 

逻辑 门 的 实现 是 使 用 属于 不 同类 型 不 同 生 产 技 术 的 逻辑 器 件 来 完成 的 。 这 些 设备 往往 用 逻 
辑 系列 来 分 类 。 每 个 系列 都 有 自己 的 优点 和 缺点 ， 每 个 系列 在 能 力 和 局 限 性 方面 也 不 尽 相 同 。 
当前 我 们 感 兴趣 的 逻辑 系列 包括 TTL、NMOS/PMOS、CMOS 和 ECL。 

TTL( 晶体 管 -晶体管 远 辑 ) 用 双 极 型 晶体 管 代 替 了 集成 电路 中 最 初 发 现 的 所 有 二 极 管 。 
(从 第 1 章 关 于 晶体 管 的 补充 材料 中 可 以 了 解 详 细 信 息 。)TTL 以 如 下 方式 定义 二 进 制 值 : 0 ~ 
0.8V 是 次 辑 0，2 ~5V 是 逻辑 1。 几 乎 任何 门 都 可 以 使 用 TTL 实现 。TTL 不 仅 提供 最 大 数量 的 
逻辑 门 (从 标准 的 组 合 和 时 序 逻 辑 门 到 存储 器 ) ， 并 且 这 种 技术 还 提供 了 更 优越 的 操作 速度 。 
这 些 相 对 便宜 的 集成 电路 的 问题 是 ， 它 们 需要 相当 大 的 功率 。 

TTL 被 用 于 广泛 销售 的 第 一 代 集 成 电路 中 。 然 而 ， 在 今天 的 集成 电路 中 最 常用 的 晶体 管 类 
型 为 MOSFET (金属 氧化 物 半 导体 场 效 应 晶体 管 ) 。 场 效应 晶体 管 ( FET) 简单 地 说 就 是 输出 场 
由 可 变 电 场 控制 的 晶体 管 。 金 属 氧 化 物 半 导体 实际 上 是 指 用 于 制造 芯片 的 工艺 ， 现 在 甚至 使 用 
多 晶 硅 代替 了 金属 ， 金 属 这 个 名 称 仍 继续 使 用 。 

NMOS (NN 型 金属 氧化 物 半 导体 ) 和 PMOS(P 型 金属 氧化 物 半导体 ) 是 两 种 基本 类 型 的 MOS 
晶体 管 。NMOS 晶体 管 比 PMOS 晶体 管 快 ， 但 是 实际 上 NMOS 相对 于 PMOS 的 优点 是 具有 更 高 的 
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元 件 密度 (更 多 个 NMOS 蝇 体 管 可 以 放 在 单个 芯片 上 )。NMOS 电路 比 其 双 极 型 具有 更 低 的 功 耗 。 
NMOS 技术 的 主要 缺点 是 对 电气 放电 损坏 的 敏感 性 ， 此 外 ，NMOS 不 能 实现 与 TIL 同样 多 的 门 电 
路 。 尺 管 NMOS 电路 比 TTL 功率 更 小 ， 但 增加 的 NMOS 电路 密度 使 功 耗 问题 变 得 明显 了 。 

我 们 设计 了 CMOS (互补 金属 氧化 物 半导体 ) 芯片 作为 TTL 和 NMOS 电路 的 低 功 耗 替代 品 ， 
除了 解决 电源 问题 外 ， 它 提供 了 比 NMOS 更 多 的 TTL 等 效 电 路 。 该 技术 使 用 FET 互补 对 代替 
双 极 晶体 管 ， 即 NMOS FET 和 PMOS FET( 因 此 称 为 “互补 ") 。CMOS 与 NMOS 不 同 ， 因 为 当 栅 
极 处 于 静态 时 ，CMOS 几乎 没有 功 耗 。 只 有 当 门 开关 改变 时 ， 才 有 功 耗 。 较 低 的 功 耗 转化 为 减 
少 散热 。 

为 此 ，CMOS 广泛 地 用 于 各 种 各 样 的 计算 机 系统 中 。 除 了 低 功 耗 之 外 ，CMOS 芯片 可 以 在 
很 宽 的 电源 电压 范围 内 工作 (通常 为 3 ~15V) ， 不 像 TTL 需要 一 个 5+0.5V 的 电源 电压 。 然 而 ， 
CMOS 技术 对 静电 极其 敏感 ， 因 此 在 处 理 电路 时 必须 格外 小 心 。 虽 然 CMOS 技术 提供 了 比 
NMOS 更 大 的 门 电路 选择 范围 ， 但 它 仍然 无 法 与 双 极 型 TTL 技术 相 匹配 。 

ECL( 射 极 耦 合 罗 辑 ) 门 用 于 需要 高 速 的 情况 。 而 TIL 和 MOS 使 用 晶体 管 作为 数字 开关 ( 晶 
体 管 处 于 饱和 或 截止 状态 ) ，ECL 使 用 晶体 管 来 引导 电流 通过 逻辑 门 ， 导 致 晶体 管 不 能 完全 关 
断 或 饱和 。 因 为 它们 总 是 处 于 活动 状态 ， 所 以 晶体 管 可 以 非常 快速 地 改变 状态 。 然 而 ， 这 种 高 
速 的 变化 需要 大 量 的 电力 。 因 此 ，ECL 很 少 使 用 ， 尤 其 是 在 很 专业 的 应 用 中 。 

作为 逻辑 系列 的 新 手 ，BiCMOS ( 双 极 CMOS ) 集成 电路 使 用 双 极 和 CMOS 技术 。 尽 管 
BiCMOS 避 辑 实 际 比 TTL 消耗 更 多 的 功率 ， 但 它 相 当 快 。 虽 然 目前 它 还 没有 在 制造 业 中 使 用 ， 
但 BiCMOS 似乎 具有 巨大 的 潜力 。 


3. 6.6 ”时序 逻辑 的 应 用 : 卷 积 编码 和 维特 比 检测 


在 数据 存储 和 通信 中 采用 几 种 编码 方法 。 其 中 之 一 是 部 分 响应 最 大 似 然 (PRML ) 编码 方 
法 。 以 前 的 讨论 (这 不 是 理解 本 节 的 前 提 ) 主要 关注 PRML 的 “部 分 响应 ”部 分 。“ 最 大 似 然 ” 
分 量 来 自 对 位 进行 编码 和 解码 的 方式 。 解 码 过 程 的 显著 特征 是 只 有 某 些 位 模式 有 效 。 这 里 使 用 
卷 积 码 产生 这 种 模式 。 维 特 比 译 码 器 读 取 通 过 卷 积 解码 器 产生 的 位 ， 并 且 将 读 取 的 符号 流 与 一 
组 “可 能 ”符号 流 进 行 比 较 ， 选 择 错误 最 少 的 一 个 输出 。 提 出 下 面 讨 论 的 原因 是 它 汇集 了 一 
系列 本 章 以 及 第 2 章 中 给 出 的 概念 。 下 面 从 编码 过 程 开始 讨论 。 

在 第 2 章 中 引入 的 汉 明 码 是 一 种 使 用 数据 块 (或 块 编码 ) 来 计算 必要 宛 余 位 的 前 向 纠 错 类 
型 。 一 些 应 用 需要 适合 连续 数据 流 的 编码 技术 ， 例 如 来 自卫 星 电视 发 射 机 的 数据 流 。 卷 积 编码 
是 对 输入 串 行 位 流 进行 操作 的 方法 ， 并 生成 编码 的 串 行 输出 流 ( 包 括 元 余 位 ) ， 使 其 能 够 连续 
校正 错误 。 卷 积 码 是 一 种 编码 过 程 ， 输 出 是 输入 和 先前 接收 的 一 些 位 数 的 函数 。 因 此 ， 输 入 在 
自身 上 重 秋 或 卷 积 以 形成 输出 符号 流 。 在 某 种 意义 上 ， 卷 积 码 构建 用 于 输出 精确 解码 的 上 下 
文 。 卷 积 编码 与 维特 比 解码 结合 成 为 在 编码 和 解码 存储 数据 或 在 不 完全 (噪声 ) 介质 上 传输 的 
公认 的 工业 标准 。 

图 3-33 显示 了 在 PRML 中 使 用 的 卷 积 编码 机 制 。 仔 细 观 察 这 个 电路 ， 它 揭示 了 两 个 输出 
位 写 入 到 了 每 个 输入 位 中 。 第 一 个 输出 位 是 输入 位 和 第 二 个 先前 输入 位 的 函数 : 4 XOR C。 第 
二 位 是 输入 位 和 两 个 先前 位 的 函数 : 4 XOR C XOR B。 在 图 的 右 侧 有 两 个 与 门 ， 当 时 钟 脉冲 到 
来 时 交替 选择 这 些 函 数 中 的 每 一 个 。 每 一 个 时 钟 脉冲 的 输入 通过 D 触发 器 移 位 。 注 意 ， 最 左边 
的 触发 器 仅 用 作 绥 冲 器 输入 ， 但 并 不 是 绝对 必需 的 。 

乍 一 看 ， 可 能 不 容易 看 到 编码 器 如 何 为 每 个 输入 位 产生 两 个 输出 位 。 诀 窍 是 位 于 时 钟 和 电 
路 其 他 组 件 之 间 的 触发 器 。 当 该 触发 器 的 互补 输出 反馈 到 输入 时 ， 触 发 器 交替 地 存储 0 和 1。 
因此 ， 每 隔 一 个 时 钟 周期 ， 输 出 变 为 高 电 平 ， 每 个 周期 应 使 能 和 禁止 正确 的 与 门 。 








时 钟 
图 3-33 PRML 卷 积 编码 器 


我 们 逐步 完成 图 3-34 所 示 的 一 系列 时 钟 周期 。 假 定编 码 器 初始 状态 是 标记 为 4、B 和 C 的 
触发 名 中 包含 所 有 0。 将 第 一 个 输入 移 和 人 4 触发 器 (缓冲 器 ) 和 编码 器 输出 两 个 0 需要 两 个 时 钟 
周期 。 图 3-34a 显示 了 编码 器 传递 到 触发 器 4 输出 后 的 第 一 个 输入 (1) 。 看 到 触发 器 4、B 和 人 
上 的 时 钟 被 使 能 ， 上 面 的 与 门 也 被 使 能 。 因 此 ， 函 数 4 XOR C 被 路 由 到 输出 。 在 下 一 个 时 钟 周 
期 ( 见 图 3-34b) ， 下 面 的 与 门 被 使 能 ， 函 数 4 XOR C XOR 中 路 由 到 输出 。 然 而 ， 因 为 触发 器 
A、B 和 CC 的 时 钟 被 禁止 ， 所 以 输入 位 不 能 从 触发 器 4 传播 到 触发 器 B， 以 防止 在 第 二 个 输出 
写 人 时 下 一 个 输入 位 被 消耗 。 在 时 钟 周期 3( 见 图 3-34c) ， 输 入 通过 和 触发 器 4 传播 ， 并 且 触 发 
髓 4 中 的 位 已 经 传播 到 触发 器 B。 输 出 上 面 的 与 门 被 使 能 ， 并 且 明 数 4 XOR C 被 路 由 到 输出 。 





时 钟 周期 1 





时 钟 周期 2 


b) 
图 3-34 通过 卷 积 编码 器 的 4 个 时 钟 周期 
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图 3-34 ( 续 ) 


该 电路 的 特性 表 如 表 3-13 所 示 。 举 个 例子 ， 考 虑 输入 位 流 11010010。 编 码 器 最 初 包含 所 有 
0,， 所 以 下 =0 且 C =0。 此 时 编码 器 处 于 状态 0(00, ) 。 当 输入 流 的 第 一 个 1 离开 缓冲 器 时 4、B =0 
且 C=0, 给 出 (4 XOR C XOR B) =1 和 (4 XOR C) =1。 输 出 为 11， 编 码 器 转换 到 状态 2(10, ) 。 
下 一 个 输入 位 为 1， 有 B=1 和 C=0( 处 于 状态 2)， 得 到 (4 XOR C XOR B) =0 和 (4 XOR C) =1， 
输出 为 01 ， 编 码 器 转换 到 状态 1(01, ) 。 在 保留 剩余 的 六 个 位 之 后 ， 完 成 的 函数 是 : 

F(1101 0010) = 11 01 01 00 10 11 11 10 


表 3-13 3-33 所 示 的 卷 积 编码 器 的 特性 表 


输入 A 当前 状态 BC 下 一 个 状态 BC 输出 
0 00 00 00 























1 00 10 11 
0 01 00 11 
1 | 01 10 | 00 
0 10 01 10 
| 
1 10 11 01 
0 11 01 | 01 
1 11 11 10 











使 用 米 莉 机 会 使 编码 过 程 更 清楚 一 些 ( 见 图 3-35 ) 。 这 个 图 一 目 了 然 地 显示 了 哪些 转换 是 
可 能 的 ， 哪 些 是 不 可 能 的 。 在 图 3-35 中 你 可 以 看 到 特性 表 与 机 器 之 间 的 对 应 关系 ， 这 个 表 是 
通过 读 取 表 和 跟踪 弧 获 得 的 。 事 实 上 ， 对 代码 错误 校正 属性 和 维特 比 译 码 器 操作 至 关 重要 的 是 
具有 有 限 的 转换 ， 译 码 器 负责 正确 地 解码 位 流 。 如 图 3-36 所 示 ， 通 过 过 渡 弧 上 的 输出 反 转 输 
入 ， 围 绕 该 组 可 能 的 解码 输入 放置 边界 。 








图 3-35 图 3-33 所 示 的 卷 积 编码 融 的 米 莉 机 图 3-36 卷 积 解码 器 的 米 莉 机 


例如 ， 假 设 解码 器 处 于 状态 1 并 且 模 式 是 00 01。 返 回 的 解码 位 值 为 11 ， 并 且 解 码 器 在 状 
态 3 中 结束 。( 路径 遍历 是 1 一 2 一 3 。) 另 一 方面 ， 如 果 解 码 器 处 于 状态 2 并 且 模 式 是 00 11， 由 
于 在 状态 2 上 没有 用 于 00 的 出 口 转换 ， 因 此 发 生 错 误 。 状 态 2 上 的 出 口 转换 是 01 和 10， 它 们 
两 个 都 有 一 个 从 00 开始 的 汉 明 距离 1。 如 果 跟 随 两 个 (同样 相等 的 ) 路 径 离开 状态 2， 解 码 器 最 
终 处 于 状态 1 或 状态 3。 可 以 看 到 对 于 下 一 个 位 对 11， 在 状态 3 上 没有 出 口 转换 。 来 自 状态 3 
的 每 个 出 口 转换 都 具有 从 11 开始 的 汉 明 距离 1。 对 于 两 个 路 径 2 一 3 一 1 和 2 一 3 一 2， 它 们 的 累 
积 汉 明 距离 为 2。 然 而 ， 状 态 1 在 11 上 具有 有 效 转 变 。 通 过 采用 路 径 2 一 1 一 0 ， 累 积 误 差 只 有 
1， 所 以 这 是 最 有 可 能 的 序列 。 因 此 ， 输 入 的 最 大 似 然 解 码 为 00。 

表示 这 个 思路 的 一 种 等 价 (也 许 更 清楚 ) 方 式 是 网 格 图 ， 如 图 3-37 所 示 。4 个 状态 在 图 的 
左边 显示 。 从 左 到 右 读 取 转 换 ( 或 时 间 ) 组 件 。 卷 积 码 中 的 每 个 码 字 都 与 网 格 图 中 的 唯一 路 径 
相关 联 。 维 特 比 译 码 器 使 用 与 此 图 等 效 的 逻辑 路 径 确 定 最 可 能 的 位 模式 。 在 图 3-37 中 ， 译 码 
器 在 状态 1 开始 遇 到 输入 序列 00 10 11 11 时 ， 状 态 转换 发 生 。 读 者 可 以 比较 网 格 图 中 的 转换 与 
图 3-36 所 示 的 米 莉 图 中 的 转换 。 

假设 在 输入 的 第 一 个 位 对 中 引入 一 个 错误 ， 给 出 错误 的 串 是 10 10 11 11。 如 前 所 述 ， 译 码 
器 在 状态 1 中 开始 ， 图 3-38 通过 网 格 跟踪 可 能 的 路 径 。 累 积 的 汉 明 距离 显示 在 每 个 过 渡 圆 弧 
上 。 正 确 的 路 径 应 是 具有 最 小 路 径 累积 误差 的 字符 串 ， 假 设 这 个 字符 串 是 00 10 11 11， 因 此 它 
被 接受 为 正确 的 序列 。 





输入 00 人 和 条 输入 10 10 11 11 





输出 1 0 0 1 输出 
图 3-37 描述 序列 00 10 11 11 状态 转换 的 网 格 图 图 3-38 描述 序列 10 10 11 11 汉 明 误差 的 网 格 图 
在 应 用 维特 比 译 码 器 的 大 多 数 情况 下 ， 译 码 器 仅 提供 一 个 电 平 误差 校正 。 在 维特 比 算法 产 
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生 一 个 干净 的 符号 流 之 后 ， 会 应 用 附加 的 纠 错 机 制 ， 例 如 循环 元 余 校 验 和 里 德 - 所 罗 门 编码 
(在 第 2 章 中 讨论 ) 。 使 用 本 章 中 描述 的 数字 构建 块 ， 所 有 这 些 算 法 通常 能 以 最 快 的 速度 在 硬件 
中 实现 。 

希望 本 节 的 讨论 能 帮助 读者 了 解数 字 化 逻辑 和 纠 错 算 法 是 如 何 配合 在 一 起 使 用 的 。 当 然 ， 
任何 算法 都 可 以 做 到 ， 只 要 其 可 以 使 用 有 限 状 态 机 来 表示 。 实 际 上 ， 刚 才 描述 的 卷 积 码 也 被 称 
为 (2，1 ) 卷 积 码 ， 因 为 对 于 每 一 个 符号 输入 会 输出 两 个 符号 。 其 他 卷 积 码 提供 了 更 复杂 的 误 
差 校正 ， 但 它们 很 难 通过 经 济 实惠 的 硬件 来 实现 。 


3.7 电路 设计 


在 前 面 的 章节 中 ， 介 绍 了 许多 不 同 的 计算 机 系统 组 件 。 但 我 们 无 法 罗列 出 帮助 读者 开始 设 
计 电 路 或 系统 的 全 部 知识 细节 。 数 字 逮 辑 设计 要 求 我 们 不 仅 熟悉 数字 逻辑 ， 也 要 精通 数字 分 析 
(分 析 输 入 和 输出 之 间 的 关系 )、 数 字 综 合 (从 真 值 表 开 始 并 确定 逻辑 图 以 实现 给 定 的 人 逻辑 功 
能 ) 和 使 用 计算 机 辅助 设计 (CAD) 软 件 。 回 想 以 前 的 讨论 可 知 ， 在 设计 电路 时 需要 非常 小 心 以 
确保 它们 最 小 化 。 电 路 设计 者 面临 许多 问题 ， 包 括 找 到 有 效 的 布尔 函数 ， 使 用 最 少数 量 的 逻辑 
门 ， 使 用 廉价 的 逻辑 门 组 合 ， 使 表面 积 最 小 以 组 织 电路 板 的 逻辑 门 和 最 小 功率 的 要 求 ， 并 尝试 
使 用 一 组 标准 的 模块 来 实现 所 有 这 一 切 。 还 有 许多 这 里 没有 讨论 的 问题 ， 如 信号 传播 、 扇 出 、 
同步 问题 和 外 部 接口 ， 你 可 以 看 到 数字 电路 的 设计 相当 复杂 。 

到 目前 为 止 ， 本 章 已 经 讨论 了 如 何 设计 寄存 器 、 计 数 器 、 存 储 器 和 各 种 其 他 数字 构建 块 。 
给 定 这 些 组 件 ， 电 路 设计 者 可 以 在 硬件 中 实现 任何 给 定 的 算法 (回顾 第 1 章 中 的 硬件 和 软件 的 
等 价 原则 ) 。 在 编写 程序 时 ， 要 指定 一 系列 布尔 表达 式 。 通 常 ， 编 写 程序 比 设计 硬件 来 实现 算 
法 要 容易 得 多 。 但 是 ， 在 有 些 情况 下 硬件 实现 更 好 (如 在 实时 系统 中 ， 硬 件 实现 速度 更 快 ， 速 
度 快 一 定 更 好 ) 。 但 是 ， 也 有 软件 实现 更 好 的 情况 。 这 通常 是 用 单个 编程 式微 计算 机 芯片 替换 
大 量 数字 组 件 ， 从 而 产生 骨 入 式 系统 。 微 波 炉 和 汽车 最 可 能 包含 戏 入 式 系统 。 这 样 做 是 为 了 和 圭 
换 可 能 会 出 现 机 械 问 题 的 硬件 。 对 这 些 艇 入 式 系统 编程 需要 所 设计 的 软件 能 够 读 取 输 入 变量 和 
发 送 输出 信号 ， 以 执行 诸如 打开 或 关闭 灯 、 发 出 蜂 鸣 声 、 发 出 警报 或 打开 门 等 任务 。 编 写 这 种 
软件 需要 理解 布尔 函数 的 行为 。 


本 章 小 结 


本 章 的 主要 目的 是 让 读者 熟悉 逻辑 设计 中 涉及 的 基本 概念 ， 并 对 使 用 基本 电路 配置 构建 计算 机 系统 
有 大 致 的 了 解 。 这 种 熟悉 程度 还 不 能 使 读者 具备 设计 这 些 组 件 的 能 力 ， 但 是 它 让 读者 对 以 下 章节 讨论 的 
架构 有 更 好 的 了 解 。 

本 章 研究 了 标准 逻辑 运算 符 AND 、OR 和 NOT 的 行为 ,并 查看 了 实现 它们 的 逻辑 门 。 任 何 布 尔 函数 
可 以 表示 为 真 值 表 ， 然 后 可 以 将 其 转换 为 逻辑 图 ， 指 示 实 现 该 功能 的 数字 电路 所 需 的 组 件 。 因 此 ， 真 值 
表 提 供 了 一 种 表示 布尔 函数 特性 以 及 逻辑 电路 的 手段 。 在 实际 中 ， 这 些 简单 的 逻辑 电路 被 组 合 起 来 以 创 
建 组件 ， 诸 如 加 法 器 、ALU、 译 码 器 、 多 路 复 用 器 、 寄 存 咒 和 存储 器 。 

在 布尔 函数 与 其 数字 表示 之 间 存 在 一 一 对 应 关系 。 布 尔 定律 可 以 化 简 布尔 表达 式 ， 从 而 最 小 化 组 合 
和 时 序 电路 。 最 小 化 在 电路 设计 中 极为 重要 。 从 芯片 设计 师 的 角度 看 ， 两 个 最 重要 的 因素 是 速度 和 成 本 ， 
最 小 化 电路 有 助 于 降低 成 本 和 提高 性 能 。 

数字 逻辑 分 为 两 类 : 组 合 逻辑 和 时 序 旬 辑 。 组 合 逻辑 器 件 (例如 加 法 器 、 译 码 器 和 多 路 复 用 器 ) 是 严 
格 基于 电流 输入 产生 输出 的 。AND 、OR 和 NOT 门 是 组 合 逻 辑 电 路 的 构建 模块 ， 也 可 以 使 用 通用 门 ， 例 
如 NAND 和 NOR。 时 序 逻辑 设备 (例如 寄存 器 、 计 数 器 和 存储 器 ) 基于 当前 输入 的 组 合 和 电路 的 当前 状态 
产生 输出 。 这 些 电路 使 用 SR、D 和 下 触发 器 构建 。 

从 前 面 的 内 容 已 经 看 到 ， 可 以 以 多 种 不 同 的 方式 表示 时 序 电路 ， 这 取决 于 要 强调 的 特定 行为 。 摩 尔 
机 、 米 莉 机 和 算法 状态 机 可 以 提供 清楚 的 图 片 。 网 格 图 表示 时 间 函 数 的 转换 。 这 些 有 限 状态 机 与 DFA 的 
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区 别 在 于 没有 最 终 状 态 ， 因 为 电路 产生 输出 而 不 接受 字符 串 。 

这 些 逻 辑 电 路 是 计算 机 系统 所 需 的 模块 。 在 第 4 章 会 把 这 些 模 块 放 在 一 起 ， 并 更 详细 地 讨论 计算 机 
实际 上 是 如 何 工作 的 。 

如 果 读 者 有 兴趣 了 解 更 多 卡 诺 图 的 内 容 ， 在 习题 之 后 ， 位 于 本 章 末尾 有 一 个 特殊 的 部 分 将 重点 介绍 
卡 诺 图 。 


扩展 阅读 


大 多 数 计算 机 组 成 和 体系 结构 方面 的 书籍 都 对 数字 逻辑 和 布尔 代数 进行 了 简要 的 讨论 。Stallings 
(2013)、Tanenbaum(2012) 以 及 Patterson 和 Hennessy(2011 ) 的 书包 含 了 很 好 的 数字 逻辑 概要 。Mano 
(1993 ) 对 卡 诺 图 (在 本 章 的 末尾 部 分 讨论 ) 简 化 和 可 编程 逻辑 器 件 进行 了 很 好 的 讨论 ， 其 中 还 包括 对 各 种 
电路 技术 的 介绍 。 关 于 数字 逻辑 更 深入 的 信息 ， 参 见 Wakerly(2000) 、Katz( 1994 ) 或 Hayes(1993 ) 的 书 。 

Davis(2000)《 通 用 计算 机 》 这 本 书 ， 追 溯 了 计算 机 理论 的 历史 ,包括 所 有 精神 思想 家 的 传记 ， 读 这 本 
书 是 一 种 快乐 。 关 于 布尔 代数 的 讨论 ， 请 看 看 Gregg( 1998 ) 的 书 。 读 Maxfield( 1995 ) 的 书 绝对 让 你 感到 嘉 
悦 ， 这 本 书包 含 布尔 逻辑 的 信息 和 复杂 的 概念 ， 以 及 有 趣 和 有 启发 性 的 琐事 (包括 海鲜 浓 汤 的 美妙 食 
谱 !)。 在 门 和 触发 器 方面 若 想 阅读 一 本 简单 易 读 的 书 (以 及 关于 计算 机 是 什么 和 它们 如 何 工作 的 )， 参 考 
Petzold( 1989 ) 的 书 。Davidson( 1979 ) 提出 了 一 种 基于 与 非 门 电路 的 分 解 方法 (我 们 感 兴趣 的 是 与 非 门 是 通 
用 门 ) 。 

Moore( 1956) 、Mealy(1955) 和 Clare( 1973 ) 首先 在 论文 中 提出 摩尔 机 、 米 莉 机 和 算法 状态 机 。Cohen 
(1991 ) 的 有 关 计 算 机 理论 书 是 关于 这 个 话题 的 最 容易 理解 的 书籍 之 一 。 在 这 里 ， 你 会 发 现 有 关 摩 尔 机 、 
米 莉 机 和 有 限 状 态 机 (包括 DFA ) 的 很 棒 的 表示 。Forney(1973 ) 在 一 篇 同名 论文 中 出 色 地 介绍 了 维特 比 算 
法 ， 解 释 了 这 种 卷 积 译 码 器 背后 的 概念 和 数学 原理 。Fisher( 1996 ) 的 文章 解释 了 PRML 如 何在 磁盘 驱动 器 
中 使 用 。 

如 果 读 者 对 实际 设计 一 些 电 路 感 兴 趣 ， 那 么 这 里 有 几 个 很 好 的 模拟 器 可 以 免费 提供 。 一 组 工具 为 
Chipmunk 系统 。 它 执行 各 种 应 用 ， 包 括 电 子 电路 仿真 、 图 形 编辑 和 曲线 绘图 。 它 包含 4 个 主要 工具 , 但 
是 对 于 电路 模拟 ，Log 是 你 需要 的 程序 。 日 志 的 Diglog 部 分 允许 你 创建 并 测试 实际 的 数字 电路 。 如 果 你 
有 兴趣 想 下 载 程序 并 在 机 器 上 运行 它 ，Chipmunk 系统 软件 包 可 以 在 www. cs. berkeley. edu/ ~lazzaro/chip- 
munk/ 找 到 。 该 分 发 可 用 于 各 种 平台 (包括 PC 和 UNIX 机 器 ) 。 

另 一 个 不 错 的 软件 包 是 Softronix 的 多 媒体 逻辑 (MMLogic) ， 但 它 目前 仅 适 用 于 Windows 平台 。 这 个 
功能 齐全 的 软件 包 有 漂亮 的 CUI， 包 括 拖 放 组 件 和 全 面 的 在 线 帮助 。 它 不 仅 包 括 设 备 的 标准 组 件 ( 如 
AND、OR、NAND 、NOR 、 加 法 器 和 计数 器 ) ， 还 有 特殊 的 多 媒体 设备 (包括 位 图 、 机 器 人 、 网 络 和 蜂 鸣 
器 设备 ) 。 可 以 创建 逻辑 电路 并 将 其 连接 到 真实 设备 ( 键盘、 屏幕 、 串 行 端口 等 ) 或 其 他 计算 机 上 。 该 软 
件 包 宣称 是 为 初学 者 开发 的 ， 但 允许 用 户 构建 相当 复杂 的 应 用 程序 ( 如 通过 互联 网 运行 的 游戏 )。MMLog- 
ic 可 以 在 www. softronix. com/logic. html 找到 ， 这 里 不 仅 包 括 可 执行 包 还 包括 源 代码 ， 以 便 用 户 可 以 修改 
或 扩展 其 功能 。 

第 三 个 数字 逻辑 模拟 器 是 Logisim( 一 个 开源 软件 包 ) ， 可 从 http:/ozark. hendrix. edu/ ~ burch/logisim/ 
获得 。 该 软件 紧凑 、 易 于 安装 和 使 用 ， 只 需要 安装 Java 5 或 更 高 版 本 ， 因 此 可 用 于 Windows、Mac 和 
Linux 平台 。 其 界面 是 直观 的 ， 与 大 多 数 模拟 器 不 同 ，Logisim 允许 用 户 在 仿真 期 间 修改 电路 。 该 应 用 程 
序 允 许 用户 构 建 不 同 规模 的 电路 ， 从 较 小 的 电路 到 较 大 的 电路 ， 用 鼠标 动作 拉 成 一 束 电 线 ( 多 位 宽度 ) ， 
并 使 用 树 视 图 查看 可 以 组 建 电路 的 组 件 库 。 如 MMLogic， 该 软件 包 被 设计 为 一 个 教育 工具 ， 以 帮助 初学 
者 试验 数字 逻辑 电路 ， 也 允许 用 户 构建 相当 复杂 的 电路 。 

任何 这 些 模拟 器 都 可 以 用 来 构建 接 下 来 在 第 4 章 中 讨论 的 MARIE 架构 。 
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复习 题 

. 为 什么 理解 布尔 代数 对 计算 机 科学 家 很 重要 ? 

. 哪 种 布尔 运算 被 称 为 布尔 乘积 ? 

. 哪 种 布尔 运算 被 称 为 布尔 和 ? 

请 为 布尔 运算 符 OR、AND 和 NOT 创建 真 值 表 。 

. 什么 是 布尔 对 偶 原 理 ? 

为 什么 在 数字 电路 设计 中 使 用 最 小 化 的 布尔 表达 式 很 重要 ? 

.晶体 管 和 逻辑 门 之 间 的 关系 是 什么 ? 

. 导 辑 门 和 电路 之 间 有 什么 区 别 ? 

. 说 出 4 种 基本 的 逻辑 门 。 

. 本 章 描述 的 两 个 通用 门 分 别 是 什么 ?” 这些 通 用 门 为 什么 很 重要 ? 

11. 描述 数字 逻辑 芯片 的 基本 结构 。 

12. 描述 行 波 进位 加 法 器 的 操作 。 为 什么 今天 大 多 数 计算 机 不 使 用 行 波 进位 加 法 器 ? 

13. 可 以 使 用 哪 3 种 方法 来 表示 布尔 逻辑 函数 的 功能 ? 

14. 在 逻辑 电路 设计 时 从 描述 入 手 ， 必 须 采 取 的 步骤 是 什么 ? 

15. 半 加 器 和 全 加 器 之 间 有 什么 区 别 ? 

16. 需要 几 个 输入 及 其 各 自 的 值 来 选择 一 个 特定 的 输出 线 ， 这 样 的 电路 是 什么 电路 ?” 说 出 这 些 器 件 的 一 
个 重要 应 用 。 

17. 什么 电路 是 从 多 个 输入 线 中 选择 一 个 二 进 制 信息 并 将 其 连 到 一 个 输出 线 ? 

18. 时 序 电 路 与 组 合 电路 有 什么 不 同 ? 

19. 时 序 电路 的 基本 元 素 是 什么 ? 

20. 当 我 们 说 时 序 电 路 是 边沿 触发 而 不 是 电 平 触发 时 ， 意 思 是 什么 ? 


js 
全 
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21. 
22; 
23. 
24. 


在 数字 电路 的 背景 下 ， 什 么 是 反馈 ? 
Jk 触发 器 与 SR 触发 器 有 什么 关系 ? 
为 什么 开 触发 器 比 SR 触发 顺 更 好 ? 
哪个 触发 器 给 出 了 计算 机 存储 器 的 真实 表示 ? 


25. 米 莉 机 与 摩尔 机 有 什么 不 同 ? 

26. 算法 状态 机 可 以 提供 而 摩尔 机 或 米 莉 机 都 不 提供 的 是 什么 ? 

习题 
* 1. 为 以 下 表达 式 构 建 真 值 表 。 

ea) 和 2 二 z(0XY) * b)x(y +z) +xyz c) (x+7y)(x'+y) (提示 : 参考 例 3.7) 
2. 为 以 下 表达 式 构建 真 值 表 。 
a) xXyz +x(y2) +x (y+2) 十 (YYyZ) b) (x+y')(x’ +z )(y +2z') 

4 3. 使 用 德 摩根 定律 ， 写 下 反 的 表达 式 ， 其 中 F(x, y, z) =xy (x +z) 

4. 使 用 德 摩根 定律 ， 写 反 的 表达 式 ， 其 中 F(x, y, z) = (xz +7y)(x+z)(y' +z)'o 
。5. 使 用 德 摩根 定律 ， 写 下 反 的 表达 式 ， 其 中 F(w, x, y, z) =xz'(x'yz+%) +y(w'z+%')o 
6. 使 用 德 摩根 定律 ， 写 FF 反 的 表达 式 ,， F(x, y, z) =xz (xy +xz) +Xy'(Wz+y)。 

7. 证 明 德 摩根 定律 的 有 效 性 。 
* 8. 下 列 分 配 法 是 否 有 效 ? 证 明 你 的 答案 。 


16. 


x XOR(y +z) = (x XOR y) + (x XOR z) 


. 以 下 是 真是 假 ” 证 明 你 的 答案 。 


(x XOR y)' = wy + (%+y)" 


.表达 x% =xy +xy' 和 

a) 使 用 真 值 表 表示 b) 使 用 布尔 定律 表示 
. 使 用 前 7 个 布尔 定律 证 明 吸收 律 。 

。 表达 式 xz = (x +y)(x+y)'(x’ +z) 

a) 使 用 真 值 表 表 示 b) 使 用 布尔 定律 表示 
. 用 任何 方法 证 明 以 下 公式 是 真是 假 。 


wa ty Fy2 = + 


; 利用 布尔 代数 及 其 定律 简化 下 面 的 隐 数 表达 式 。 并 列 出 每 一 步 使 用 的 定律 。 


a) F(x, y, 2) =y(%’' +(%+y)') b) F(x, y, 2) =%'yz+xz 
c) F(x, y, 2) = (x +y+2 )' +Xy'z + yz + XY 


. 利用 布尔 代数 及 其 定律 简化 下 面 的 函数 表达 式 。 并 列 出 每 一 步 使 用 的 定律 。 


a) x(yzs +yz2) +Xy +Xy + az b) xyz" + (y+2z)' 十 和 "yz 

c) z(Cxy' +z)(X%+Y ) 

利用 布尔 代数 及 其 定律 简化 下 面 的 函数 表达 式 。 并 列 出 每 一 步 使 用 的 定律 。 
a) z(wW+X)' 十 好 Xz 十 WO0XYZ + WX yz b)y'(x'z +xz) +z(X+TY) 


c) %(yz' +%) (YY +2) 


17. 利用 布尔 代数 及 其 定律 简化 下 面 的 函数 表达 式 。 并 列 出 每 一 步 使 用 的 定律 。 
4a)%(y+z)(x' +z) b) xy +xyz 十 XY + yz 


18. 


* 19. 


C) xy z+X(Y +2 ) 十 XY 

利用 布尔 代数 及 其 定律 简化 下 面 的 函数 表达 式 。 并 列 出 每 一 步 使 用 的 定律 。 
a) y(xz’ +X'z) +y (xz +%'z) b) x(y’z+y) +x (y+z’)" 
c) x[yz+(y+z)'](x'y+z) 

利用 布尔 代数 的 基本 定律 证 明 


%(%’ + yy) = Xy 
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*20, 利用 布尔 代数 的 基本 定律 证 明 


xX+Xy =%+y 


21. 利用 布尔 代数 的 基本 定律 证 明 


* 22. 


23. 


2S. 


26. 


27. 


XY + XZ+YE = XY + Xz 


布尔 表达 式 的 真 值 表 如 下 所 示 。 用 乘积 的 和 的 形式 写 出 布尔 表达 式 。 





一 | 一 | 一 Ilei=iel 一 | 





























~* sis | || 
|-iolo|l-|-|jolocol<x 


iol-|o|l-|lo|l-|olN 














布尔 表达 式 的 真 值 表 如 下 所 示 。 用 乘积 的 和 的 形式 写 出 布尔 表达 式 。 








ool-|lo|l-|o|lN 


口 | 口 | 一 | 一 = 一 | 一 = 上 | 机 





-十 




















-|-|-|lolo 


一 | 已 | 一 











- 下 列 哪个 布尔 表达 式 在 逻辑 上 不 等 价 于 其 余 的 表达 式 ? 


a) WOX 十 WOY 十 10Z b)w+x’ 十 Y +z 

c) W(x +Y +2z) d) Wo yz + waxy 二 WOY + wz 

绘制 真 值 表 ， 作 为 两 个 乘积 项 的 和 的 补充 ， 重 写 下 面 的 表达 式 : 
XY 十 % 7 十 XZ 十 yz 

给 出 布尔 函数 FLzx，y，z) =x'y +xyz': 

a) 推导 下 反 的 代数 表达 式 ， 并 以 乘积 的 和 的 形式 表示 。 

b) 证 明 FF' =0。 

c) 证 明 F+F =1。 

给 定 公式 F(x, y, z) =y(x'z+xz’) +x(yz +yz'): 

a) 列 出 五 的 真 值 表 。 

b) 使 用 原始 布尔 表达 式 绘制 逻辑 图 。 

c) 使 用 布尔 代数 及 其 定律 简化 表达 式 。 

d) 对 于 c 中 答案 列 出 真 值 表 。 

e) 为 c 中 的 简化 表达 式 绘制 逻辑 图 。 


.只 使 用 AND、OR 和 NOT 门 构造 XOR 运算 符 。 
29. 
. 仅 使 用 与 非 门 来 绘制 半 加 法 器 。 
31. 


仅 使 用 与 非 门 构造 XOR 运算 符 。 提 示 : x XORyY=((xy) (xy ) ) 。 


仅 使 用 与 非 门 来 绘制 全 加 器 。 
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32. 设计 具有 3 个 二 进 制 输入 数位 x、y 和 = 的 电路 ， 并 且 3 个 输出 (a、b 和 *) 同样 也 表示 为 二 进 制 数 位 。 
当 输 入 为 0、1、6 或 7 的 时 候 ， 二 进 制 输出 将 是 输入 的 反 。 当 二 进 制 输入 为 2、3、4 或 5 的 时 候 ， 输 
出 为 输入 的 循环 左 移 。( 例如， 输入 为 3 =011, 时 输出 为 110; 输入 为 4=100, 时 输出 为 001。) 画 出 真 
值 表 ， 对 所 有 计算 进行 简化 ， 画 出 最 后 的 电路 。 
* 33. 直接 绘制 组 合 电 路 实现 布尔 表达 式 : 
F(x,y,2) = xyz + (y' +2z) 
34. 直接 绘制 组 合 电 路 实现 布尔 表达 式 : 
F(x,y,2) = 和 十 MY 十 
35. 直接 绘制 组 合 电 路 实现 布尔 表达 式 : 
F(x,y,2) = (x(y XOR z)) + (xz)" 
* 36. 找到 描述 以 下 电路 的 真 值 表 : 


加 


QZ 


这 


37. 找到 描述 以 下 电路 的 真 值 表 : 
上 


x 


8. 找到 描述 以 下 电路 的 真 值 表 : 


3 


人 


了 


2 


39. 如 果 译 码 器 有 64 个 输出 ， 那 么 请 问 有 多 少 个 输入 ? 

40. 如 果 一 个 多 路 复 用 器 有 32 个 输入 ， 请 问 有 多 少 条 控制 线 ? 

41. 分 别 绘制 电路 以 实现 表 3-10 和 表 3-11 所 示 的 奇偶 校 验 发 生 器 和 奇偶 校 验 检查 器 。 
42. 假设 你 有 函数 F(x,，y,，z) 和 F(x，y，z) 的 真 值 表 : 


x 
nn 
Ry 


一 局 一 口 一 口 一 虽 怖 


一 





~ Oo-~o ol 
OOooo- ~ -~ 
一 一 口 口 一 一 口 口 


a) 以 乘积 和 的 形式 表示 Fl 和 FF,。 
b) 简化 每 个 也 数 。 
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43. 


45. 
. 描述 以 下 每 个 电路 的 工作 原理 ， 并 指出 典型 的 输入 和 输出 。 同 时 为 每 个 电路 提供 仔细 标记 的 “ 黑 


47. 


c) 绘制 一 个 逻辑 电路 以 实现 上 述 两 个 函数 。 
假设 你 有 函数 Fi(w,， x,y, z) 和 FF,(w，x，y，z) 的 真 值 表 : 








w x y z Fi 户 
0 0 0 0 0 0 
0 0 0 1 1 1 
0 0 1 0 0 0 
0 0 1 1 ] 1 
0 1 0 0 0 0 
0 ] 0 ] 0 0 
0 1 1 0 0 0 
0 1 1 1 0 0 
1 0 0 0 0 0 
1 0 0 1 1 0 
1 0 1 0 0 0 
1 必 1 1 0 
1 1 0 0 1 1 
1 1 0 1 1 1 
1 1 1 0 1 1 
1 1 1 1 1 1 
a) 以 乘积 和 的 形式 表示 F 和 F,。 b) 简化 每 个 函数 。 


c) 绘制 一 个 逻辑 电路 以 实现 上 述 两 个 隐 数 。 


. 设计 组 合 电路 的 真 值 表 ， 用 于 检测 BCD 编码 的 十 进 制 数 字 表 示 的 误差 。( 当 输入 为 6 个 未 使 用 的 BCD 


码 组 合 之 一 时 ， 此 电路 输出 应 为 1。) 
简化 习题 4 中 的 函数 并 绘制 逻辑 电路 。 


人 礼 ” 图 。 
a) 译 码 器 b) 多 路 复 用 需 
小 苏 珊 正 试图 训练 新 买 的 小 狗 。 她 试图 摘 清 楚 什么 时 候 小 狗 应 该 得 到 一 块 狗 饼 干 作为 奖励 。 她 总 结 如 下 : 
1. 如 果 小 狗 坐 和 摇摆 ， 但 不 叫 ， 给 一 块 饼干 。 
2. 如 果 小 狗 叫 和 摇摆 ， 但 不 坐 ， 给 一 块 饼干 。 
3. 如 果 小 狗 坐 ， 但 不 摇摆 或 叫 ， 给 一 块 饼 干 。 
4. 如 果 小 狗 坐 、 摇 摆 和 叫 ， 给 一 块 饼干 。 
5. 否则 不 要 给 小 狗 饼干 。 
使 用 以 下 内 容 : 
S 代表 坐 (0 为 不 坐 、1 为 坐 ) 
歼 代 表 摇 摆 (0 表示 不 摇摆 、1 表示 摇摆 ) 
8B 代表 叫 (0 为 不 叫 、1 为 叫 ) 
代表 饼干 函数 (0 表示 不 给 饼干 、1 表示 给 饼干 ) 
构造 一 个 真 值 表 ， 并 找到 最 简 的 布尔 函数 来 实现 逻辑 ， 该 函数 可 以 告诉 苏 丙 什 么 时 候 给 小 狗 饼干 。 


. 蒂 龙 . 休 和 雷 斯 在 股票 市 场 投入 了 大 量 资金 , 但 不 相信 任何 人 给 他 的 买卖 信息 。 他 买 某 只 股票 之 前 ， 


必须 从 3 个 来 源 获 得 消息 。 他 的 第 一 个 来 源 是 佩 恩 : 韦伯 斯 特 ， 他 是 一 个 著名 的 股票 经 纪 人 。 他 的 
第 二 个 来 源 是 麦 格 * A. 卡 什 ， 他 是 一 个 在 股市 上 白手 起 家 的 百 万 富翁 。 他 的 第 三 个 来 源 是 世界 著名 
的 心理 学 家 拉萨 拉夫 人 。 经 过 从 这 三 个 人 那里 接受 几 个 月 的 建议 后 ， 他 得 到 以 下 结论 : 

a) 如 果 佩 思 和 麦 格 都 说 买 并 且 心 理学 家 说 不 买 ， 那 么 就 买 。 

b) 如 果 心 理学 家 说 买 ， 那 么 就 买 。 


*+49. 


5S3. 
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c) 其 他 情况 都 不 买 。 

构造 一 个 真 值 表 ， 并 找到 最 简 的 布尔 函数 来 实现 逻辑 ， 告 诉 蒂 龙 什么 时 候 应 该 买 。 

假设 一 家 很 小 的 公司 聘请 你 安装 一 个 安全 系统 。 你 安装 的 系统 的 品牌 价格 是 由 允许 访问 设施 中 某 些 
位 置 感应 卡 上 编码 的 位 数 决定 的 。 当 然 ， 这 家 小 公司 想 要 使 用 尽 可 能 少 的 编码 位 数 ( 花 尽 可 能 少 的 
钱 ) ， 但 是 能 满足 所 有 的 安全 需求 。 你 需要 做 的 第 一 件 事 是 确定 每 张 卡 需要 多 少 位 。 接 下 来 ， 你 必须 
在 每 个 安全 位 置 对 读 卡 器 编程 ， 以 便 它 们 对 扫描 卡 做 出 适当 的 响应 。 

该 公司 有 4 种 类 型 的 员工 和 5 个 他 们 和 希望 限制 权限 的 区 域 。 员 工 及 其 权限 如 下 : 

a) 老板 需要 使 用 行政 休息 室 和 行政 洗手 间 。 

b) 老板 的 秘书 需要 访问 供应 柜 、 员 工 休 息 室 和 行政 酒 廊 。 

c) 计算 机 室 员工 需要 访问 服务 器 机 房 和 员工 休息 室 。 

d) 看 门人 需要 进入 工作 场所 的 所 有 区 域 。 

确定 每 类 员工 将 在 卡 上 如 何 编码 ， 并 为 读 卡 器 在 五 个 权限 区 域 上 构造 逮 辑 图 。 


. 完成 以 下 时 序 电路 的 真 值 表 : 








一 个 状态 


完成 以 下 时 序 电路 的 真 值 表 : 
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55. 时 序 电 路 具有 一 个 触发 器 、 两 个 输入 开 和 和 一 个 输出 $。 它 包括 一 个 连接 到 下 触发 器 的 全 加 器 电 
路 ， 如 下 图 所 示 。 通 过 填写 下 一 状态 和 输出 列 ， 完 成 该 时 序 电路 的 真 值 表 。 








56. 真 或 假 : 当下 触发 器 由 SR 触发 器 构成 时 ，S$=JO ，R=AKO。 
4#+S7. 调查 以 下 电路 的 操作 。 假 设 初 始 状态 为 0000。 跟 踪 输 出 (@) 作为 时 钟 记号 ， 确 定 该 电路 的 目的 。 必 
须 显 示 轨 迹 才能 完成 答案 。 





S8. Null- Lobour 触发 器 (NL 触发 器 ) 的 行为 如 下 : 如 果 N=0， 则 触发 器 不 改变 状态 。 如 果 NN =1， 则 触发 
器 的 下 一 状态 等 于 了 的 值 。 
a) 推导 NL 触发 器 的 特性 表 。 
b) 通过 添加 逻辑 门 和 反 相 器 ， 显 示 SR 触发 器 如 何 转换 为 NL 触发 器 。( 提 示 : 当 N=1 时 ,S$ 和 RR 的 
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值 必须 是 多 少 ， 将 使 触发 器 在 适当 的 时 间 置 位 和 复位 ? 当 =0 时 如 何 防止 触发 器 改变 状态 ? ) 


S9. Mux-Not 触发 器 (MN 触发 器 ) 的 行为 如 下 : 如 果 M=1， 则 触发 器 为 当前 状态 的 反 。 如 果 1MW =0， 则 触 


发 器 的 下 一 状态 等 于 NN 的 值 。 

a) 推导 触发 器 的 特性 表 。 

b) 如 何 通 过 添加 门 和 反 相 器 将 下 触发 器 转换 为 MN 触发 器 ? 
60. 列 出 在 图 3-32 所 示 的 4 x3 存储 器 电路 中 读 取 一 个 字 所 需 的 步骤 。 
61. 构建 摩尔 机 和 米 莉 机 ， 补 充 它们 的 输入 。 

62. 构造 一 个 计数 模 为 5 的 摩尔 机 。 
63. 分 别 使 用 摩尔 机 和 米 莉 机 ， 构 造 两 个 奇偶 校 验 检 查 器 。 
64. 使 用 两 个 FSM 相等 的 定理 ， 当 且 仅 当 它 们 从 相同 的 输入 字符 串 产 生 相 同 的 输出 ， 证 明 摩尔 机 和 米 莉 

机 相等 。 

65. 使 用 本 章 中 描述 的 卷 积 编码 和 维特 比 算法 ， 假 设 编码 器 和 译 码 器 总 是 在 状态 0 开始 ， 确 定 如 下 问题 : 

a) 从 输入 字符 串 10010110 生成 输出 字符 串 。 

b) 在 问题 a 的 序列 之 后 ， 编 码 器 处 于 哪 种 状态 ? 

c) 哪个 位 在 字符 串 中 出 错 ，11 01 10 11 11 11 10? 字符 串 中 可 能 值 是 什么 ? 

66. 重复 问题 65 以 确定 以 下 内 容 : 

a) 输入 字符 串 00101101 生成 输出 字符 串 。 

b) 在 a 中 写 和 的 序列 之 后 ， 编 码 器 处 于 哪 种 状态 ? 

c) 哪个 位 在 字符 串 中 出 错 ，00 01 10 11 00 11 00? 字符 串 的 可 能 值 是 什么 ? 

67. 重复 问题 65 以 确定 以 下 内 容 : 

a) 输入 字符 串 10101010 生成 输出 字符 串 。 

b) 在 a 中 写 入 的 序列 之 后 ， 编 码 器 处 于 哪 种 状态 ? 

c) 哪个 位 在 字符 串 中 出 错 ，11 10 01 00 00 11 01? 字符 串 的 可 能 值 是 什么 ? 

68. 重复 问题 65 以 确定 以 下 内 容 : 

a) 输入 字符 串 01000111 生成 输出 字符 串 

b) 在 a 中 写 入 的 序列 之 后 ， 编 码 器 处 于 哪 种 状态 ? 

c) 哪个 位 在 字符 串 中 出 错 ，11 01 10 11 01 00 01? 字符 串 的 可 能 值 是 什么 ? 


特别 关注 : 卡 诺 图 


3A.1 引言 

本 章 主要 关注 布尔 表达 式 及 其 与 数字 电路 的 关系 。 简 化 这 些 电 路 有 助 于 减少 在 实际 物 
理 实 现 中 的 元 器 件数 量 。 具 有 较 少 的 元 器 件 可 以 使 电路 更 快 地 操作 5 

可 以 使 用 布尔 定律 化 简 布 尔 表达 式 ， 然而， 使 用 定律 可 能 很 困难 ， 因 为 没有 给 出 如 何 
使 用 定律 或 者 何 时 使 用 定律 ， 并 上 且 没 有 明确 定义 一 组 要 遵循 的 步骤 。 一 方面 ， 简 化 布尔 表 
达 式 非常 像 在 做 证 明 : 你 知道 何 时 在 正确 的 轨道 上 ， 但 有 时 在 到 达 时 可 能 令 人 温 表 和 费 
时 。 在 本 部 分 ， 介 绍 一 种 系统 方法 来 简化 布尔 表达 式 。 


3A.2 卡 诺 图 和 术语 描述 
卡 诺 图 或 K 图 (Kmaps) 是 表示 布尔 函数 的 图 形 方式 。 映 射 只 是 一 个 表 ， 这 个 表 用 于 列 


举 不 同 输入 值 对 应 的 布尔 函数 值 。 行 和 列 对 应 于 函数 可 能 的 输入 值 。 每 个 单元 格 代表 那些 
可 能 的 输入 值 的 函数 输出 。 
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如 果 乘 积 项 正好 包括 所 有 变量 一 次 ， 即 原 变量 或 反 变量 ， 则 该 乘积 项 称 为 最 小 项 。 仍 
如 ， 如 果 存 在 两 个 输入 x 和 y， 则 存在 4 个 最 小 项 x'y'、x'y、xy' 和 xy， 它们 表示 函数 所 有 
可 能 的 输入 组 合 。 如 果 输 入 变量 是 x*、y 和 z， 则 存在 8 个 最 小 项 : x'y'z'、 ww'Y'z、 wy、 yz、 
My/Z yz XYyz' Fh wyzo 

作为 示例 ， 假 设 布尔 函数 F(x, y) =xy+x'yo。% 和 yy 的 可 能 输入 如 图 3A-1 所 示 。 最 小 
项 x'y' 表 示 输 入 对 (0，0) 。 同 理 ， 最 小 项 x'y 表示 (0, 1)， 最 小 项 xy' 表 示 (1, 0)， 最 小 项 
妙 表 示 (1，1)。 

三 个 变量 的 最 小 项 以 及 它们 表示 的 输入 值 如 图 3A-2 所 示 。 


XI 





YX 
wy! 

















让 
图 3A-1 两 个 变量 的 最 小 项 图 3A-2 3 个 变量 的 最 小 项 
卡 诺 图 是 一 个 表 ， 其 中 每 个 单元 格 对 应 最 小 项 。 这 意味 着 函数 真 值 表 的 每 行 对 应 一 个 
单元 格 。 考 虑 函数 F(x，y) = 妨 和 它 的 真 值 表 ， 如 例 3A. 1 所 示 。 
F(x; y) =%y 





< 





~ © Olx 
一 已 一 已 | 一 


© 








对 应 的 卡 诺 图 是 : 
了 
0 1 
Ql orl to 
Blo < 
请 注意 ， 卡 诺 图 中 唯一 为 1 的 单元 格 出 现在 x*=1 和 y=1 时 ,相同 的 值 在 真 值 表 中 是 
xy 三 各 时 od 正面 请 看 为 一 个 例子 ,下 (%， YY) =w+Yo 


F(x, y) =%+y 


x 


x 
Se 
x 
Ss 





0 0 0 y 

0 1 1 区 0 1 

] 6 i VD | 

1 1 1 二 | 








例 3A.2 中 有 3 个 最 小 项 的 值 为 1， 正 好 是 函数 的 输入 和 输出 至 少 有 一 个 为 1 的 最 小 
项 。 要 在 卡 诺 图 中 设置 1， 只 需要 在 真 值 表 中 找到 相应 1 的 地 方 放置 1。 可 以 将 函数 
F(x，Yy) =x+y 表示 为 所 有 最 小 项 的 逻辑 或 ， 其 中 最 小 项 的 值 为 1。 然 后 F(x，,Y) 可 以 表示 为 
表达 式 x'y+xy'+xy。 显 然 ， 这 个 表达 式 不 是 最 小 化 的 (我 们 已 经 知道 这 个 函数 的 最 简 形式 
是 x+y)。 可 以 使 用 布尔 定律 化 简 。 
F(x,y) = x’y +xy +xy 
= XY+Xy+xy +Xxy ( 记 住 ,xy + xy = xy) 
= y(x" +%) +X(CY +y) 
=y+%x 
三 和 十 Y 
我 们 如 何 知 道 添加 一 个 额外 的 xy 项 呢 ? 使 用 布尔 定律 化 简 可 能 是 很 束 手 的 。 这 时 卡 诺 
图 可 以 帮助 我 们 。 


3A.3 用 卡 诺 图 化 简 两 个 变量 

先前 对 函数 (x, y) 的 化 简 的 目标 是 对 各 项 进行 分 组 ,使 得 变量 因子 可 以 分 解 出 
来 。 添 加 了 xy 项 来 组 合 x'y， 这 使 得 能 够 计算 出 yY， 留 下 x +x， 它 可 以 化 简 为 1!， 如 果 
使 用 卡 诺 图 化 简 ， 不 必 担 心 要 添加 哪些 项 或 哪些 项 要 使 用 布尔 定律 。 卡 诺 图 能 够 帮助 
化 简 。 

请 再 看 看 图 3A-3 所 示 的 (x,y) =x+y 的 卡 诺 图 。 


要 想 使 用 卡 诺 图 来 化 简 布 尔 函 数 ， 只 需要 对 1 y 
进行 分 组 。 这 种 分 组 类 似 于 在 使 用 布尔 定律 化 简 时 ,全 
对 项 进行 的 分 组 ， 除 了 必须 遵循 的 特定 规则 。 第 中 


一 ， 只 对 1 分 组 。 第 二 ， 如 果 1 在 同一 行 或 者 同一 

列 ， 但 它们 不 在 对 角 线 上 ( 即 它们 必须 是 相 邻 单 。 图 3A-3 F(x, 7) =x+y 的 卡 诺 图 

元 ) ， 那 么 可 以 在 卡 诺 图 中 对 1 进行 分 组 。 第 三 ， 如 果 组 中 的 总 数 是 2 的 矫 ， 则 可 以 

sr 第 四 ， 必 须 使 组 尽 可 能 大 。 第 五 ， 所 有 1 必须 在 一 个 组 中 (即使 一 些 
一 组 中 )。 如 图 3A-4~ 图 3A-7 所 示 ， 人 ee 


0 1 x 0 1 
0 a 0 re 
村 





后 Er a ) 不 正确 b ) 正确 
3A-4 组 中 只 包括 1 图 3A-5 组 不 能 是 对 角形 式 
了 于 有 
x 0 1 x 0 1 x 0 1 
oT oo "TO 
六 1|CQ THD iL ED 
a ) 不 正确 b ) 正确 a ) 不 正确 
3A-6 组 必须 是 2 的 宕 图 3A-7 组 必须 尽 可 能 大 


注意 在 图 3A-6b 和 图 3A-7b 中 ， 有 一 个 1 属于 两 个 组 。 这 等 价 于 将 xy 项 添加 到 布尔 函 
数 中 ， 就 像 使 用 定律 执行 简化 所 做 的 那样 。 卡 诺 图 中 的 xy 在 简化 过 程 中 使 用 两 次 。 
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为 了 使 用 卡 诺 图 化 简 ， 首 先 创建 由 上 述 规则 指定 的 组 。 找 到 所 有 组 后 ， 检 查 每 个 组 并 
丢弃 每 个 组 内 不 同 的 变量 。 例 如 ， 图 3A-7b 给 出 了 (x, y) =x+y 的 正确 分 组 。 从 第 二 行 
表示 的 组 开始 (其 中 * =1) ， 两 个 最 小 项 是 录 ' 和 wy。 此 组 表示 这 两 个 项 的 慑 辑 或 ， 即 xy' + 
xyo。 这 些 项 在 y 上 不 同 ， 因 此 yy 被 丢弃 ， 只 留 下 x。( 可 以 看 到 ， 如 果 使 用 布尔 定律 ， 将 会 
得 到 相同 值 。 卡 诺 图 允许 采取 一 个 捷径 ， 帮 助 我 们 自动 丢弃 正确 的 变量 。) 第 二 组 表示 xiy + 
xyo。 这 些 项 在 x 土 不 同 ， 所 以 x 被 丢弃 ， 留 下 y。 将 第 一 组 和 第 二 组 的 结果 组 进行 OR 运 
算 ， 得 到 x+y， 这 是 原始 函数 下 的 正确 简化 形式 。 


3A. 4 ”用 卡 诺 图 化 简 三 个 变量 

卡 诺 图 可 以 应 用 于 两 个 以 上 变量 的 表达 式 中 。 在 本 部 分 ,我们 显示 了 三 变量 和 四 变量 
卡 诺 图 。 这 些 可 以 扩展 为 有 五 个 或 更 多 个 变量 的 情况 。 在 本 节 的 扩展 阅读 部 分 中 ，Maxfield 
(1995) 的 书 将 会 使 你 彻底 和 愉快 地 理解 卡 诺 图 。 

你 已 经 知道 如 何 为 有 两 个 变量 的 表达 式 设置 卡 诺 图 。 这 里 只 是 将 这 个 想法 扩展 到 3 个 
变量 ， 如 图 3A-8 所 示 。 

你 应 该 注意 到 的 第 一 个 区 别 是 ， 在 表 中 两 个 变 并 
量 y 和 z 被 组 合 起 来 了 。 第 二 个 区 别 是 列 编号 不 是 ”0 
按 上 顺序 的 。 这 里 将 列 标 记 为 00、01、11、10( 正 常 ”中 az | yz | 7 
二 进 制 )， 而 不 是 00、01、10、11。 卡 诺 图 的 输入 2 ee 
佳 具 大 懂 顺 序 对 列 ， 记 全 春水 量 小 项 室 有 有 椒 变 量 、， 及 休 和 的 于 人 全 全 下 
不 同 于 相 邻 单元 。 通 过 使 用 此 顺序 (例如 ，01 后 跟 11)， 对 应 的 最 小 项 x'y'z 和 ww'yz 仅 在 y 
变量 上 不 同 。 记 住 ， 要 化 简 就 需要 丢弃 不 同 的 变量 。 因 此 ， 必 须 确保 每 组 的 两 个 最 小 项 中 
只 有 一 个 变量 不 同 。 

在 两 个 变量 的 实例 中 找到 的 最 大 组 是 由 两 个 1 构成 的 。 这 个 组 也 可 能 具有 四 个 甚至 八 
个 1， 这 取决 于 函数 。 下 面 来 看 看 化 简 3 个 变量 的 表达 式 的 例子 。 


WE F(x, y, 2) =x'y z+x yz +ry'z + yz 


00 01 11 10 





x 00 01 11 10 
ro yg 
| 
再 次 遵循 分 组 规则 ， 你 能 够 看 到 可 以 以 不 同 的 方式 分 两 个 组 。 然 而 ， 规 则 规定 必须 创 
建 大 小 为 2 的 等 的 最 大 组 。 四 个 1 可 以 为 一 组 ， 所 以 分 组 如 下 : 


4 
01 11 10 


x 00 
wD i 
ro | . 
没有 必要 创建 两 个 额外 的 组 。 组 越 少将 会 有 更 少 的 项 。 记 住 ， 要 想 化 简 表 达 式 ， 所 要 
做 的 就 是 保证 每 一 个 1 都 在 一 些 组 中 。 
当 某 一 组 有 四 个 1 时 ， 如 何 化 简 ? 组 中 有 两 个 1 时 允许 丢 弃 一 个 变量 。 若 组 中 有 四 个 
1， 则 允许 丢弃 两 个 变量 : 这 四 项 中 不 同 的 两 个 变量 。 前 面 的 例子 中 ， 组 中 的 四 项 有 以 下 
最 小 项 : x'y'z、x'yz、Xy'z 和 xyz。 这 些 项 都 有 z， 但 x 和 yy 变量 不 同 。 所 以 丢弃 YY 和 7yY， 下 
(*，Yy，2z) =z 作为 最 终 化 简 结 果 s 要 想 了 解 它 与 使 用 布尔 定律 的 简化 有 何 相 似 之 处 ， 请 考 
虑 使 用 定律 来 简化 。 注 意 ， 该 函数 最 初 表示 为 值 1 与 最 小 项 的 逻辑 或 。 





F(x,y,2) = % 7'z tx yz XYyz + xyz 

= x (yzZ+ 7) +x(yz+ yz) 

= (x +%)(y'z+ yz) 

= yz+yz 

= Fy)z 
使 用 布尔 定律 的 最 终结 果 与 使 用 卡 诺 图 化 简 的 结果 完全 相同 。 
有 时 ， 分 组 过 程 可 能 有 点 棘手 。 下 面 来 看 一 个 需要 更 仔细 观察 的 例子 。 
F(x, y, 2) =%y'2 十 %'Y'z 十 XIZ 十 % ye 十 WOZ + XYyz" 


这 是 一 个 棘手 的 问题 ， 原 因 有 两 个 : 有 重 亚 的 组 和 “环绕 ”的 组 。 第 一 列 最 左边 的 1 
可 以 与 最 后 一 列 最 右边 的 1 分 为 一 组 ， 因 为 第 一 列 和 最 后 一 列 在 逻辑 上 相 邻 (设想 卡 诺 图 
是 在 圆柱 体 上 绘制 的 ) 。 卡 诺 图 的 第 一 行 和 最 后 一 行 在 逻辑 上 也 相 邻 ， 在 下 一 节 讨 论 四 变 
量 卡 诺 图 时 这 会 变 得 很 明显 。 


正确 的 分 组 如 下 : 
y 
% 00 01 11 10 
OE ds de J 
Ue 
第 一 组 化 简 为 x, (这 是 四 项 中 唯一 共同 的 项 )， 第 二 组 化 简 为 z， 所 以 最 终 的 最 简 函 
数 是 F(x%, yy, 2) 三 x’ + 十 
假设 有 二 个 卡 诺 图 的 内 容 都 是 1。 
J2 
Xx 00 01 11 10 
9 汪汪 
" 


可 以 找到 的 含有 1 的 最 大 组 有 八 项 ， 其 中 所 有 的 1 在 同一 组 。 如 何 简化 ?遵循 一 直 以 
来 的 规则 。 记 住 ， 两 组 允许 丢弃 一 个 变量 ， 而 四 组 允许 丢弃 两 个 变量 ， 因 此 ， 八 组 应 该 允 
许 丢弃 三 个 变量 。 但 这 是 所 有 的 变量 ! 如 果 丢 弃 所 有 变量 ,会 留 下 (x, y, z)=1。 如 果 
用 真 值 表 来 检查 此 函数 ， 你 会 看 到 这 确实 是 正确 的 
简化 。 se 


3A.5 用 卡 诺 图 化 简 四 个 变量 

现在 将 卡 诺 图 化 简 扩 展 到 4 个 变量 。4 个 变量 给 
出 了 16 个 项 ， 如 图 3A-9 所 示 。 注 意 特殊 的 顺序 11 
后 跟 10， 这 适用 于 所 有 行 和 列 。 

例 3A.6 说 明了 有 4 个 变量 的 函数 表示 和 化 简 。 
我 们 只 关心 1 的 情况 ， 所 以 在 卡 诺 图 中 省 略 了 0。 





图 3A-9 4 个 变量 的 最 小 项 和 卡 诺 图 
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WEE Flw, x, y, 2) =w x yz +w XY z+ XY + Ww Ay + WX YZ + WX YZ + 


WX "yz" 





如 前 面 所 见 ， 第 一 组 是 一 个 “环绕 ”组 。 第 三 组 很 容易 找到 。 第 二 组 代表 最 终 的 环绕 
组 : 它 由 四 个 角落 的 1 组成。 记 住 ， 这 些 角 在 逻辑 上 相 邻 。 最 后 的 结果 是 下 减少 到 三 项 ， 
每 组 中 有 一 个 : x'y'( 来 自 组 1), x'z'( 来 自 组 2), w'yz'( 来 自 组 3)。F 的 最 终 化 简 形 式 为 
F(w, %, y» 2) =%'y 十 Xi 二 2。 a 

偶尔 ， 在 执行 化 简 时 可 以 使 用 一 些 选择 。 考 虑 例 3A.7。 

5 选择 组 





第 一 列 可 清楚 地 分 组 。 此 外 ，zw'x'yz 和 w'xyz 项 应 分 为 一 组 。 然 而 需要 选择 如 何 分 组 
w'xyz' 项 ， 它 可 以 与 w'wyz 或 w'xy'z'( 作 为 环绕 ) 分 组 。 这 两 种 解决 方案 如 下 。 





第 一 个 图 化 简 为 Fw,，x,，y, z) = =y'z'+w'yz+w'xy。 第 二 个 图 化 简 为 F(w, xz，7y， 
z) = =y'z +w'yz +w'xz'o 最 后 的 项 是 不 同 的 。 然 而 和 FR 是 等 效 的 。 把 它 交 给 下 和 
F 的 真 值 表 来 检查 是 否 相等 。 它 们 都 有 相同 数量 的 项 和 变量 。 如 果 遵 循 规 则 ， 卡 诺 图 最 小 
化 会 导致 有 最 小 化 函数 (因此 电路 最 小 ) ， 但 这 些 最 小 化 函数 在 表示 中 不 需要 是 唯一 的 。 本 

在 继续 下 一 节 之 前 ， 总 结 一 下 卡 诺 图 化 简 的 规则 。 

1. 组 中 只 能 包含 1， 不 能 包含 0。 

2. 只 有 相 邻 的 1 可 以 分 为 一 组 ， 不 允许 对 角 分 组 。 

3. 组 中 1 的 数量 必须 是 2 的 办 。 

4. 组 必须 尽 可 能 大 ， 同 时 仍 遵循 所 有 规则 。 

5. 所 有 1 必须 属于 一 个 组 ， 即 使 是 单个 元 素 的 组 。 





6. 允许 重合 组 。 

7, 移 洗 环绕 。 

8. 使 用 尽 可 能 少 的 组 数 。 

使 用 这 些 规则 ， 再 完成 一 个 四 变量 函数 的 例子 。 例 3A.8 示 给 出 了 各 种 规则 的 若干 
应 用 。 

F(w,%,y,2) = wx yz tw XY + WXYZ + W XYZ + WXY'Z + WXYZ + WX YZ + WX YZ" 





在 这 个 例子 中 ， 有 一 个 单元 素 的 组 。 注 意 ， 如 果 遵 守 规则 ， 则 没有 办 法 将 这 个 项 与 任 
何其 他 项 分 为 1 组。 由 这 个 卡 诺 图 表示 的 函数 简化 为 F(w, x, yy, 2z) =yz+Xz+w'X'y'z 十 
WX Yo 可 

如 果 给 出 的 函数 没有 写 为 最 小 项 的 和 ,仍然 可 以 使 用 卡 诺 图 来 实现 最 小 化 函数 。 但 
是 ,在 化 简 之 前 你 不 得 不 使 用 一 个 与 设置 卡 诺 图 有 些 相 反 的 过 程 。 例 3A.9 说 明了 该 过 程 。 

函数 没有 表示 为 最 小 项 之 和 

假设 给 定 函 数 (w, x，y，z) =w'xy +w'x'yz +w'x'yz'。。 最 后 两 项 是 最 小 项 ， 我 们 可 以 
很 容易 地 把 1 放 在 卡 诺 图 的 适当 位 置 。 然 而 ，w'xy 不 是 最 小 项 。 假设 这 项 是 你 在 卡 诺 图 上 
执行 分 组 的 结果 。 被 丢弃 的 是 z 项 ， 这 意味 着 这 个 项 相当 于 w'xyz' +w'xyz 两 项 。 你 现在 可 
以 在 卡 诺 图 中 使 用 这 两 项 ， 因 为 它们 都 是 最 小 项 。 现 在 得 到 以 下 卡 诺 图 : 





所 以 ,函数 F(w，%，y，z) =w'xy +w'x'yz+wix'yz' 可 以 化 简 为 Fw, x%, Y, 2) =w'y。 本 


3A.6 无关 条 件 

在 某 些 情况 下 ， 可 能 不 能 完全 指定 函数 。 这 意味 着 函数 可 能 有 一 些 未 定义 的 输入 。 例 
如 ， 假 设 有 一 个 函数 有 4 个 输入 ，0 ~10( 十 进 制 ) 作 为 二 进 制 计数 位 。 使 用 位 组 合 0000、 
0001、0010、0011、0100、0101、0110、0111、1000、1001 和 1010。 但 是 不 使 用 组 合 1011、 
1100、1101、1110 和 1111。 后 面 的 这 些 输入 将 是 无 效 的 ， 这 意味 着 如 果 查 看 真 值 表 ， 这 些 
值 不 会 是 0 或 1。 它 们 不 应 该 在 真 值 表 中 。 

化 简 卡 诺 图 时 ， 可 以 使 用 这 些 无 关 输 入 的 优势 。 因 为 它们 是 不 重要 的 输入 值 ( 并且 是 
不 应 该 发 生 的 ) ， 所 以 可 以 让 它们 有 0 或 1 的 值 ， 这 取决 于 哪个 对 我 们 帮助 最 多 。 基 本 思想 
是 设置 这 些 无 关 值 ， 使 它们 要 么 有 助 于 构成 一 个 更 大 的 组 , 要么 它们 根本 不 贡献 。 例 
3A. 10 阐 杰 了 该 概念 。 
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无 关 条 件 

无 关 值 通常 在 适当 的 单元 格 中 用 “x” 表示 。 下 面 的 卡 诺 图 展示 了 如 何 使 用 这 些 值 来 
帮助 最 小 化 。 将 第 一 行 中 的 值 视 为 1， 以 形成 四 个 1 一 组 。 行 01 和 11 中 的 无 关 值 被 视 为 
0。 因 此 化 简 为 Fi(w, x; y, z) =w'x’ +yzo 





使 用 这 些 分 组 ， 最 终 得 到 F,(w,，x，y，,，z) =w'z+yz 的 简化 形式 。 注 意 ， 在 这 种 情况 
下 ,Fi 和 FF, 不 相等 。 但是， 如 果 你 为 两 个 函数 创建 真 值 表 ， 则 应 该 看 到 它们 仅 在 “无 关 ” 
的 那些 值 上 不 相等 。 a 


3A.7 总 结 


本 部 分 简要 介绍 了 卡 诺 图 和 卡 诺 图 化 简 。 使 用 布尔 定律 来 化 简 很 策 拙 ， 甚 至 可 能 是 非 
常 困难 的 s 从 另 一 方面 来 说 ， 卡 诺 图 提供 了 一 组 精确 的 步骤 来 寻找 函数 的 最 小 化 表示 ， 从 
而 得 到 函数 所 表示 的 最 小 化 电路 。 


练习 
1. 使 用 以 下 卡 诺 图 为 定义 的 布尔 函数 写 出 一 个 简化 的 表达 式 : 
*a) 、\J2Z *b) \J22 
x 00 01 11 10 | 00 01 11 10 
| OO eae | te 
全 人 | 1 
*c) \ 二 
x 00 01 11 10 
alta lO 
ee yl i a 
2. 使 用 以 下 卡 诺 图 为 定义 的 布尔 函数 写 出 一 个 简化 的 表达 式 : 
$a) Nd hjNz2 
x Xx 00 01 





SEE 
0 
3. 创建 卡 诺 图 ， 然 后 化 简 以 下 函数 : 
a) Fw y, 2) XY NY + ye 
b) F(x%, y, 2) =%'y'z +% yz +Xyz’ +%yz 
ce) F(x, Yy, 2) =7 2 二 YXJ2 
4. 使 用 以 下 卡 诺 图 为 定义 的 布尔 函数 写 出 一 个 简化 的 表达 式 : 





4b) 





6. 创建 卡 诺 图 ， 然 后 化 简 以 下 函数 (保留 乘积 和 的 形式 ): 
*a) F(w, x%, y, 2) =WX yz twX Ys tw XY z+W XY + Ww NYE + WX YZ + WX YZ 
bb) F(w, x, y, 2) =wx yz tw XY z+Wx YZ + WEY + WX YZ 
ec) F(w, x, YY, 2) =Yz2+wy +w' XY +w XIZ + wx yz 
7. 创建 卡 诺 图 ， 然后 化 简 以 下 函数 (保留 乘积 和 的 形式 ): 


a) F(w, %, Y, 2) =w% yz + x ye + Ww XYz + Ww XY + XY + WXY'Z + WXYZ + WX Y 
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A pe 


b) F(w, x%, y, 2) =w'%y2 +w z+Ww YY +w Xz 十 20X 7 


j= psy ,人 


c) F(ws %, YY, 2) =W'%Yy +w Xz + WXz + WX YZ 
8. 给 定 下 面 的 卡 诺 图 ，( 使 用 布尔 定律 ) 说 明 四 个 项 如 何 化 简 为 一 个 项 。 


J 
下 00 01 11 10 


有 
WE Doe 
*9. 为 由 以 下 卡 诺 图 定义 的 布尔 函数 编写 一 个 简化 表达 式 : 


98) 、 咏 4b) ~、 开 
A 10 wx 
OH oe Ol 
| 


10. 为 由 以 下 卡 诺 图 定义 的 布尔 函数 编写 一 个 简化 表达 式 : 


ea) 和 过 *b) 









a) 


x 
0 
0 
0 
0 
1 
1 
1 
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Se he 
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4.1 引言 


现在 ， 设 计 一 台 计 算 机 是 一 个 经 过 大 量 专业 训练 的 工程 师 才 能 胜任 的 工作 。 根 据 本 书 这 样 
介绍 性 的 书籍 (和 一 门 计 算 机 组 成 与 体系 结构 的 入 门 课程 ) ， 设 计 出 一 台 像 我 们 今天 可 以 买 到 
的 计算 机 是 不 可 能 的 。 然 而 ， 在 本 章 中 ,我们 首先 来 介绍 一 个 非常 简单 的 名 为 MARIE 
(Machine Architecture that is Really Intuitive and Easy ) 的 计算 机 。 然 后 我 们 对 Intel 和 MIP 处 理 器 
作 进行 概述 ， 这 两 个 主流 的 处 理 器 架构 体现 了 CISC 与 RISC 的 设计 理念 。 本 章 的 目的 是 让 你 了 
解 计 算 机 的 功能 。 我 们 按照 Leonardo da Vinci 在 开篇 给 的 建议 , 保持 体系 结构 尽 可 能 简单 。 


4.2 CPU 基本 知识 和 组 织 结构 

从 第 2 章 的 学 习 中 ， 我 们 知道 计算 机 必须 能 对 二 进 制 数 据 进 行 操作 。 我 们 也 从 第 3 章 知道 
内 存 用 于 存储 二 进 制 形式 的 数据 和 程序 指令 。 按 照 某 种 方式 ， 程 序 必须 执行 ， 数 据 必须 正确 处 
理 。 中 央 处 理 单元 ( CPU) 负责 读 取 程序 指令 ， 并 对 读 取 的 指令 进行 译 码 ， 然 后 在 正确 的 数据 上 
执行 规定 的 操作 序列 。 要 想 了 解 计算 机 是 如 何 工 作 的 ， 你 必须 首先 熟悉 它们 的 各 个 组 成 部 分 和 
这 些 组 件 之 间 是 如 何 交互 的 。 为 了 方便 了 解 下 一 节 介绍 的 简单 结构 ,我 们 先 来 了 解 一 下 现代 计 
算 机 控制 级 的 微 体系 结构 。 

每 个 计算 机 都 有 一 个 CPU， 它 可 以 分 为 两 部 分 。 第 一 部 分 是 数据 通路 ( datapath) ， 它 是 一 
种 由 存储 单元 (寄存 器 ) 和 算术 逻辑 单元 (对 数据 执行 各 种 操作 ) 组 成 的 网 络 。 这 些 组 件 通过 总 
线 ( 总线 是 传递 数据 的 电子 线路 ) 连接 起 来 ， 并 利用 时 钟 来 控制 时 序 。 第 二 部 分 是 控制 单元 ， 
该 模块 负责 对 各 种 操作 进行 排序 并 保证 各 种 正确 的 数据 适时 地 出 现在 所 需 的 地 方 。 这 些 组 件 一 
起 执行 CPU 的 任务 : 读 取 指 令 、 译 码 指令 和 按 规定 的 顺序 执行 各 种 操作 。 数 据 通路 与 控制 单 
元 的 设计 直接 影响 一 台 计 算 机 的 性 能 。 因 此 ， 我们 在 下 面 的 部 分 中 详细 介绍 了 CPU 的 这 些 组 
成 部 分 。 


4.2.1 寄存 器 


寄存 器 是 计算 机 系统 中 用 作 存 储 各 种 数据 的 器 件 ， 这 些 数据 包括 地 址 、 程 序 计数 值 和 执行 
程序 所 必需 的 数据 。 简 单 地 说 ， 寡 存 器 是 一 种 存储 二 进 制 数据 的 硬件 设备 。 寄 存 器 位 于 处 理 器 
内 部 ， 所 以 处 理 器 可 以 非常 快 地 访问 寄存 器 中 存储 的 各 种 信息 。 从 第 3 章 中 我 们 知道 ， 可 以 使 
用 D 触发 器 来 实现 寄存 器 。 一 个 D 触发 器 相当 于 一 位 寄存 器 ， 所 以 D 触发 器 的 集合 可 以 存储 
多 位 值 。 例 如 ， 要 想 建立 一 个 16 位 寄存 器 ， 我 们 需要 把 16 个 D 触发 器 连接 在 一 起 。 通 过 第 3 
章 中 的 二 进 制 计数 器 示意 图 ， 我 们 知道 这 些 触发 器 的 工作 时 钟 必须 一 致 。 在 时 钟 的 每 个 脉冲 到 
来 时 ， 输 入 数据 进入 寄存 器 ， 并 在 下 一 个 时 钟 脉 冲 到 来 之 前 不 能 改变 (也 就 是 所 谓 的 存储 ) 。 

计算 机 上 的 数据 处 理 通常 是 在 寄存 器 中 存储 的 固定 大 小 的 二 进 制 字 上 完成 的 。 因 此 ， 大 多 
数 计算 机 都 有 各 种 大 小 的 寄存 器 。 常 见 的 大 小 包括 16 位 、32 位 和 64 位 。 不 同 架 构 计 算 机 的 寄 
存 器 的 数量 不 同 ， 但 通常 是 2 的 倍数 ，16、32 还 有 64 是 最 常见 的 。 寄 存 器 包含 数据 、 地 址 或 
控制 信息 。 有 些 寄存 器 被 指定 为 “专用 ”寄存 器 ， 它 可 能 只 包含 数据 、 只 有 地 址 或 仅 有 控制 
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言 息 。 其 他 寄存 器 更 通用 ， 可 以 在 不 同 的 时 间 保 存 数 据 、 地 址 和 控制 信息 。 

可 以 向 寄存 器 写 和 人 或 从 其 中 读 取 信息 ， 信 息 也 可 以 在 不 同 的 寄存 器 之 间 传 递 。 寄 存 器 的 编 
址 方式 与 存储 器 不 同 (每 一 个 存储 器 字 都 有 一 个 唯一 的 二 进 制 地 址 ， 这 些 地 址 从 0 开始 进行 编 
码 ) 。 寄 存 器 是 由 CPU 内 部 的 控制 单元 进行 编 址 和 处 理 的 。 

在 现代 计算 机 系统 中 有 各 种 不 同类 型 的 专用 寄存 器 : 存储 信息 的 寄存 器 、 数 值 移 位 的 寄存 
器 、 数 值 比 较 的 寄存 器 和 计数 寄存 器 ， 还 有 用 来 存储 临时 数据 值 的 “中 间 结 果 ” 寄 存 器 用 来 
控制 程序 循环 操作 的 索引 寄存 器 ， 用 于 管理 所 处 理 信 息 堆栈 的 堆栈 指针 寄存 器 ， 用 于 保持 各 种 
工作 状态 或 操作 模式 (比如 溢出 、 进 位 或 一 些 零 条 件 等 ) 的 状态 寄存 器 和 给 程序 员 用 的 通用 寄 
存 器 。 大 多 数 计算 机 都 有 寄存 器 集 ， 每 个 集合 都 有 特定 的 使 用 方式 。 例 如 ，Pentium 体系 结构 
有 一 个 数据 寄存 器 集 和 一 个 地 址 寄存 器 集 。 某 些 体系 结构 有 非常 大 的 寄存 器 集 ， 这 些 寄存 器 可 
以 用 相当 新 奇 的 方法 来 加 快 指令 的 执行 速度 。( 我 们 在 第 9 章 会 讨论 这 个 主题 。) 


4.2.2 ALU 


算术 逻辑 单元 (ALU ) 在 程序 执行 过 程 中 用 于 执行 逻辑 运算 (如 比较 运算 ) 和 算术 运算 ( 如 加 
法 和 乘法 运算 ) 。 在 第 3 章 我 们 看 到 了 一 个 简单 的 有 关 ALU 的 例子 。 一 般 情况 下 ，ALU 有 两 个 
数据 输入 和 一 个 数据 输出 。 在 ALU 中 执行 的 各 种 操作 常常 会 影响 状态 寄存 器 的 某 些 数据 位 ( 设 
置 这 些 数 据 位 是 为 了 指示 某 些 动作 ， 如 是 否 有 溢出 发 生 ) 。 通 过 控制 单元 发 出 的 信号 ，ALU 可 
以 执行 各 种 规定 的 运算 。 


4. 2.3 控制 单元 


控制 单元 是 CPU 中 的 “警察 ”或 “交通 管理 员 ”。 它 负责 监视 所 有 指令 的 执行 和 各 种 信息 
的 传输 过 程 。 控 制 单元 负责 从 存储 器 中 提取 指令 ， 对 这 些 指 令 进 行 译 码 ， 确 保 数 据 适时 地 出 现 
在 正确 的 地 方 。 控 制 单元 还 负责 通知 ALU 应 该 使 用 哪 一 个 寄存 器 ， 执 行 哪些 中 断 服务 程序 ， 
以 及 对 在 ALU 中 执行 各 种 操作 接 通 正确 的 电路 。 控 制 单元 使 用 一 个 名 为 程序 计数 器 的 寄存 器 
来 寻找 下 一 条 要 执行 的 指令 ， 并 使 用 一 个 状态 寄存 器 来 存放 某 些 特殊 的 操作 状态 ， 比 如 溢出 、 
进位 、 借 位 等 。4. 13 节 会 更 详细 地 介绍 控制 单元 。 


4.3 ”总线 


CPU 通过 总 线 与 其 他 组 件 进行 通信 。 和 总 线 就 是 一 组 连 线 的 集合 ， 它 作为 一 种 共享 的 而 又 常 
见 的 数据 通路 连接 系统 内 的 多 个 子 系统 。 它 由 多 条 线路 组 成 ， 允 许多 位 数据 并 行 传递 。 虽然 总 
线 成 本 低 ， 但 是 非常 灵活 ， 而 且 它们 很 容易 把 新 设备 和 系统 连接 到 一 起 。 在 任何 时 候 ， 只 有 一 
个 设备 (可 能 是 一 个 寄存 器 、ALU 、 存 储 器 或 其 他 组 件 ) 可 以 使 用 总 线 。 不 过 ， 这 种 共享 往往 会 
导致 通信 瓶颈 。 总 线 的 速度 受 其 长 度 以 及 共享 设备 的 数量 影响 。 通 常 ， 设 备 分 为 主 设备 和 从 设 
备 ; 主 设备 是 最 初 启动 操作 的 设备 ， 从 设备 是 响应 主 设备 请 求 的 设备 。 

总 线 可 以 以 点 对 点 的 方式 连接 两 个 特定 的 设备 (如 图 4-1a 所 示 ) ， 或 者 将 总 线 用 作 一 条 公 
用 通道 来 连接 多 个 设备 ， 这 要 求 多 个 设备 共享 总 线 (简称 多 点 总 线 ， 如 图 4-1b 所 示 ) 。 

由 于 需要 共享 总 线 ， 所 以 总 线 协议 (使 用 规则 ) 非 常 重要 。 图 4-2 给 出 了 一 个 典型 的 总 线 ， 
它 包 括 : 数据 线 、 地 址 线 、 控 制 线 和 电源 线 。 通 常用 于 数据 传递 的 总 线 称 为 数据 总 线 。 这 些 数 
据 线 必 须 包含 从 一 个 位 置 移动 到 另 一 个 位 置 的 实际 信息 。 控 制 线 指 示 哪 些 设备 有 使 用 总 线 的 权 
限 ， 以 及 使 用 目的 是 什么 (例如 ， 从 存储 器 还 是 从 IO 设备 中 读 取 数据 或 写 人 数据 ) 。 控 制 线 也 
传输 总 线 请 求 的 应 答 ， 确 认 中 断 和 时 钟 同步 信号 。 地 址 线 表示 数据 的 位 置 (例如 ， 在 存储 器 
中 ) ， 该 数据 应 该 被 读 取 或 写 人 。 电 源 线 提供 必要 的 电力 。 典 型 的 总 线 事务 包括 发 送 地 址 (用 
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于 读 或 写 ) ,将 数据 从 存储 器 传输 到 寄存 带 ( 存储器 读 )， 还 有 将 数据 从 寄存 絮 传 送 到 存储 器 
(存储 器 写 )。 此 外 ， 用 于 WO 的 总 线 可 从 外 围 设备 读 取 和 写 入 。 每 个 类 型 的 传输 发 生 在 一 个 总 
线 周期 内 ， 总 线 周 期 是 完成 总 线 信息 传送 所 需 的 时 钟 脉冲 间隔 。 






计算 机 1 





计算 机 2 


由 于 总 线 传输 的 信息 种 类 和 使 用 的 设备 不 同 ， 所 以 总 线 本 身 也 分 为 不 同 的 类 型 。 处 理 器 - 
内 存 总 线 比 较 短 ， 是 高 速 总 线 ， 它 与 机 器 的 存储 系统 完全 匹配 ， 以 最 大 限度 地 提高 带宽 (数据 
传输 ) ， 通 常 是 专门 设计 的 。VO 总 线 通 常 比 处 理 器 - 内 存 总 线 长 ， 并 允许 多 种 类 型 的 设备 具 
有 不 同 的 带宽 ， 这 些 总 线 兼 容许 多 不 同 的 体系 结构 。 底 板 总 线 ( 见 图 4-3 ) 实 际 上 是 构建 在 机 顺 
主板 上 的 总 线 ， 它 的 连接 处 理 器 、LO 设备 和 存储 器 (所 有 设备 共享 一 根 总 线 ) 。 许 多 计算 机 有 
总 线 的 层次 结构 ， 所 以 在 同一 系统 中 有 两 个 总 线 (例如 ， 一 个 处 理 器 -内 存 总 线 和 一 个 1O 总 
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线 ) 或 更 多 的 情况 是 不 常见 的 。 高 性 能 系统 通常 使 用 所 有 3 种 类 型 的 总 线 。 





图 4-2 典型 总 线 的 组 成 





图 4-3 ”底板 总 线 


对 于 总 线 ， 个 人 计算 机 有 专门 的 术语 。 使 用 一 条 名 为 系统 总 线 的 内 部 总 线 连 接 CPU、 内 存 
和 所 有 其 他 内 部 组 件 。 而 采用 外 部 总 线 ( 有 时 称 为 扩展 总 线 ) 来 使 各 种 外 围 设备 、 扩 展 插 槽 和 
LO 端口 连接 到 计算 机 的 其 余部 分 。 大 多 数 PC 也 有 局 部 总 线 ， 可 以 将 外 设 直接 连接 到 CPU 的 
数据 总 线 上 。 这 些 高 速 总 线 只 能 连接 有 限 数 量 的 类 似 设备 。 扩 展 总 线 速度 较 慢 ,但 允许 更 多 的 
通用 连接 。 在 第 7 章 将 详细 讨论 这 个 话题 。 

从 物理 结构 上 来 说 ， 总 线 只 是 一 些 导线 的 集合 。 但 它们 有 专用 的 连接 器 标准 、 时 序 、 信 令 
规范 和 严格 的 协议 。 同 步 总 线 是 由 时 钟 控制 的 ， 各 种 事件 只 有 在 时 钟 脉冲 到 来 时 才 会 发 生 ( 事 
件 发 生 的 顺序 由 时 钟 脉冲 来 控制 ) 。 每 个 设备 都 由 时 钟 频率 来 进行 同步 。 总 线 周 期 时 间 是 上 述 
总 线 时 钟 频 率 的 倒数 。 例 如 ， 如 果 总 线 时 钟 频 率 为 133MHz， 那 么 总 线 周期 是 1/133 000 000s 或 
7. 52ns。 由 于 时 钟 控制 各 种 事务 ， 所 以 任何 时 钟 偏 移 (时 钟 浮 动 ) 都 有 可 能 导致 问题 ， 这 意味 着 
总 线 必须 尽 可 能 短 ， 这 样 时 钟 浮动 不 会 太 大 。 此 外 ， 总 线 周 期 不 能 短 于 信息 在 总 线 上 传送 所 需 
要 的 时 间 。 因 此 ， 总 线 的 长 度 限 制 了 总 线 时 钟 频率 和 总 线 周期 。 

各 种 控制 线 都 是 使 用 异步 总 线 来 负责 协调 计算 机 的 各 种 操作 的 ， 这 种 异步 总 线 必 须 采 用 一 
种 较为 复杂 的 握手 协议 来 强制 其 与 计算 机 其 他 操作 的 同步 。 要 想 从 内 存 中 读 取 数据 ， 协 议 将 需 
要 如 下 步骤 : 

1. ReqREAD: 激活 这 个 总 线 上 的 控制 线 ， 同 时 存储 数据 的 地 址 被 放 在 对 应 的 总 线 上 。 

2. ReadyDATA: 当 存 储 系统 已 经 把 需要 的 数据 放 在 数据 总 线 上 时 ， 控 制 线 被 置 位 。 

3. ACK: 该 控制 线 是 用 来 表示 已 经 接收 到 了 ReqREAD 或 ReadyDATA 信和 号 的 应 答 。 
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使 用 协议 而 不 是 时 钟 协调 事物 意味 着 异步 总 线 技术 更 加 灵活 ， 可 以 支持 更 广泛 的 设备 。 

要 想 使 用 总 线 ， 设 备 必须 保留 它 ， 因 为 任意 时 刻 总 线 只 能 被 一 个 设备 使 用 。 如 上 所 述 ， 总 
线 主 控 设 备 是 允许 最 初 传 递 信 息 (控制 总 线 ) 的 设备 ,而 总线 受 控 (从) 设备 是 由 主 控 设备 激活 
的 模块 ， 由 于 各 种 从 设备 是 通过 响应 主 控 设备 的 请 求 来 读 写 数据 的 ，( 所 以 只 有 主 控 设备 可 以 
保留 总 线 ) 。 使 用 总 线 的 设备 都 遵循 相同 的 通信 协议 ， 在 特定 的 时 序 下 工作 。 在 一 个 非常 简单 
的 系统 (如 我 们 在 下 一 节 中 提出 的 ) 中 只 允许 处 理 器 成 为 总 线 主 控 设 备 。 这 在 避免 混乱 方面 是 
很 好 的 ， 但 缺点 是 ， 处 理 器 要 处 理 涉及 使 用 总 线 的 每 一 个 事务 。 

对 于 有 多 个 主 控 设 备 的 系统 ， 则 需要 总 线 仲 裁 机 制 ， 它 必须 为 某 些 主 控 设 备 设 定 一 种 优先 
级 别 ， 同 时 又 保证 各 个 主 控 设 备 都 有 机 会 使 用 总 线 。 总 线 仲裁 分 为 4 种 方式 : 

1. 菊花 链 仲裁 方式 : 该 设计 使 用 一 个 “总 线 允 许 ” 控 制 线 ， 该 总 线 是 从 最 高 优先 级 设备 
传 给 最 低 优 先 级 设备 的 。( 公 平 性 没有 得 到 保证 ， 低 优先 级 的 设备 可 能 被 “ 狐 死 ”， 并 且 永 远 
不 允许 使 用 总 线 。) 该 方案 简单 但 不 公平 。 

2. 集中 式 并 行 仲裁 方式 : 每 个 设备 都 有 一 个 到 总 线 的 请 求 控制 线 和 一 个 选择 谁 可 以 使 用 
总 线 的 仲裁 控制 器 。 使 用 这 种 类 型 的 仲裁 可 能 会 导致 瓶颈 。 

3. 采用 自选 择 的 分 配 式 仲裁 方式 : 该 设计 类 似 于 集中 仲裁 ， 但 不 是 通过 中 央 控 制 锅 选择 
谁 得 到 总 线 ， 而 是 设备 本 身 决 定 谁 具有 最 高 优先 级 和 谁 应 该 得 到 总 线 使 用 权 。 

4. 采用 冲突 检测 的 分 配 式 仲裁 方式 : 允许 每 个 设备 对 总 线 发 送 请 求 。 如 果 总 线 检测 到 任 
何冲 突 (多 个 同时 请 求 )， 则 设备 必须 发 出 男 一 个 请 求 。( 以太 网 使 用 这 种 类 型 的 仲裁 。) 

第 7 章 有 更 多 关于 总 线 和 相关 协议 的 信息 。 


4.4 时钟 

每 台 计 算 机 都 有 一 个 控制 指令 执行 速度 的 内 部 时 钟 。 时 钟 也 对 系统 中 各 个 部 件 的 操作 进行 
协调 和 同步 。 当 时 钟 脉冲 到 来 时 ， 它 设置 一 切 在 系统 中 发 生 的 事物 的 步调 ， 就 像 一 个 节拍 器 或 
交响 乐队 的 指挥 。CPU 使 用 这 个 时 钟 信 号 来 调控 系统 的 各 个 进程 ， 检 测 系统 中 的 各 种 数字 逻辑 
门 电路 是 否 会 出 现 其 他 不 可 预测 的 速度 。 执 行 CPU 的 每 条 指令 都 是 使 用 固定 的 时 钟 脉冲 数目 
的 。 因 此 ， 指 令 的 性 能 通常 是 通过 时 钟 周 期 (时 钟 脉冲 的 时 间 间 隔 ) 的 数目 ( 而 不 是 秒 ) 来 测量 
的 。 时 钟 频 率 ( 有 时 称 为 时 钟 速率 或 时 钟 速度 ) 是 以 兆赫 (MHz ) 或 千 兆 赫 效 (CHz) 为 单位 的 ， 正 
如 我 们 在 第 1 章 中 看 到 的 ， 时 钟 周期 时 间 ( 或 时 钟 周期 ) 就 是 时 钟 频 率 的 倒数 。 例 如 ， 一 台 标 示 
800MHz 的 计算 机 ， 其 时 钟 周期 时 间 为 1/800 000 000s 或 1.25ns。 如 果 机 器 的 时 钟 周期 时 间 为 
2ns， 则 表示 它 是 一 台 500MHz 的 机 央 。 

大 多 数 计算 机 系统 都 是 同步 的 : 计算 机 只 有 一 个 主 控 时 钟 信 号 ， 主 控 时 钟 按照 规定 的 时 间 
间隔 发 送 脉冲 (从 0 变 成 1 再 变 成 0， 等 等 ) 。 计 算 机 中 的 各 个 寄存 器 都 必须 等 待 时 钟 脉 冲 发 生 
跃 变 时 才能 输入 新 的 数据 。 这 样 看 起 来 ， 似 乎 只 要 提高 时 钟 速度 ,计算 机 就 可 以 运行 得 更 快 。 
但 实际 上 ， 在 设计 时 钟 周期 时 存在 许多 限制 。 当 时 钟 脉冲 发 生 跃 变 时 ， 各 个 寄存 器 会 装 入 新 数 
据 ， 同 时 寄存 器 的 输出 结果 也 可 能 发 生 改变 。 这 些 发 生变 化 的 输出 值 必须 通过 系统 中 的 电路 进 
行 传递 ， 直 到 到 达 下 一 组 寄存 器 的 输入 端 ， 然 后 存储 于 输入 端 。 因 此 ， 时 钟 周期 必须 足够 长 ， 
以 保证 这 些 改变 可 以 传递 到 下 一 组 寄存 器 中 。 如 果 时 钟 周 期 太 短 ， 则 可 能 会 有 某 些 变化 的 数值 
还 未 来 得 及 到 达 下 一 组 寄存 器 ， 就 中 止 了 传递 过 程 的 情况 。 这 样 将 导致 系统 出 现 前 后 矛盾 的 状 
态 ， 必 须 避 免 这 种 情况 。 因 此 ， 最 小 的 时 钟 周 期 时 间 至 少 应 该 大 于 数据 从 一 组 寄存 器 的 输出 到 
下 一 组 寄存 器 的 输入 所 需要 的 传递 时 间 ， 即 电路 的 最 大 传输 延迟 时 间 。 事 实 上 ， 可 以 通过 在 输 
出 寄存 器 和 对 应 的 输入 寄存 器 之 间 增 加 寄存 器 的 方法 来 减 小 传输 延迟 。 注 意 ， 由 于 没有 时 钟 脉 
冲 的 跃 变 寄 存 器 不 会 改变 输出 值 ， 所 以 增加 额外 的 寄存 器 ， 事 实 上 等 于 增加 了 时 钟 周 期 的 数 
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目 。 例 如 ， 原 来 需要 2 个 时 钟 周期 执行 一 条 指令 ， 现 在 可 能 会 需要 3 个 或 4 个 时 钟 周 期 (也 可 
能 需要 更 多 的 时 钟 周 期 ， 这 取决 于 额外 寄存 器 的 具体 放置 位 置 ) 。 

执行 大 多 数 机 器 指令 需要 一 个 或 两 个 时 钟 周期 ， 但 某 些 指令 则 可 能 需要 35 个 时 钟 周期 或 
更 多 。 下 面 的 公式 表示 的 是 CPU 的 时 钟 周期 和 时 间 之 间 的 关系 。 

CPU 时 间 = 时 间 (s)/ 程序 =〈 指 令 / 程序 ) x (平均 周期 /指令 ) x (时 间 (s)/ 周 期 ) 

注意 ， 计 算 机 的 体系 结构 对 其 性 能 有 很 大 影响 。 两 台 具 有 相同 时 钟 速度 的 计算 机 在 执行 相 
同 的 指令 时 所 花费 的 时 钟 周期 数 可 能 不 一 样 。 例 如 ， 在 一 个 早期 的 Intel 286 计算 机 执行 乘法 运 
算 需 要 20 个 时 钟 周 期 ， 但 一 个 新 款 的 Pentium 可 以 在 1 个 时 钟 周期 内 完成 乘法 运算 ， 这 意味 着 
即使 它们 有 相同 的 内 部 系统 时 钟 ， 新 机 器 的 速度 是 旧 机 器 的 20 倍 。 在 一 般 情 况 下 ， 乘 法 操作 
比 加 法 操作 需要 更 多 的 时 钟 周期 ， 浮 点 运算 比 整数 运算 需要 更 多 的 时 钟 周期 ， 而 访问 存储 器 要 
比 访问 寄存 器 需要 更 多 的 时 钟 周期 。 

一 般 来 说 ， 当 我 们 提 到 时 钟 时 ， 指 的 是 系统 时 钟 ， 即 控制 CPU 和 其 他 部 件 的 主 控 时 钟 。 
然而 ， 某 些 总 线 也 配 有 自己 的 时 钟 。 总 线 时 钟 通常 比 CPU 时 钟 慢 ， 这 样 就 造成 了 系统 的 瓶颈 
问题 。 

系统 的 各 个 部 件 都 有 明确 的 性 能 界定 范围 ， 这 些 界定 会 标示 出 这 些 部 件 实现 功能 所 需要 
的 最 长 时 间 。 计 算 机 制造 商都 可 以 保证 他 们 生产 的 部 件 可 以 在 给 定 技术 范围 内 的 最 极端 条 
件 下 正常 工作 。 如 果 把 计算 机 的 各 个 部 件 按 某 种 设计 顺序 连接 起 来 ， 则 这 种 顺序 安排 会 要 
求 某 个 部 件 必 须 在 另 一 个 部 件 动作 前 完成 其 操作 ， 这 样 整个 计算 机 才能 正常 工作 。 因 此 ， 
各 个 部 件 本 身 的 性 能 界定 对 于 计算 机 各 部 件 的 同步 工作 是 非常 重要 的 。 但 是 , 许多 人 常常 
会 超过 这 些 技 术 限 制 ， 以 增强 系统 的 性 能 。 例 如 ， 超 频 运行 就 是 人 们 为 达到 某 种 目的 经 常 
采用 的 一 种 方法 。 

虽然 许多 部 件 都 可 以 超频 运行 ,但 是 CPU 是 最 流行 的 超频 组 件 之 一 。CPU 超频 的 基本 思 
想 是 让 CPU 运行 在 制造 商 给 出 的 时 钟 频率 或 总 线 速度 上 限 之 外 。 尽 管 这 样 可 以 增强 系统 的 工 
作 性 能 ， 但 是 操作 时 需要 特别 小 心 ， 以 避免 系统 的 时 序 故障 ,或 者 更 糟糕 的 是 使 CPU 过 热 。 
系统 总 线 同样 也 可 以 超频 ， 在 系统 的 各 部 件 之 间 通 过 总 线 进行 通信 时 可 以 超频 运行 。 系 统 总 线 
的 超频 运行 可 以 大 幅度 改善 系统 的 性 能 ， 但 是 同样 也 可 能 损害 与 总 线 相连 的 各 种 部 件 ， 或 者 会 
造成 这 些 部 件 的 工作 不 稳定 。 


4.5 输入 /输出 子 系统 

人 们 通过 输入 /输出 (IO) 设 备 与 计算 机 进行 通信 ， 输 入 /输出 是 指 各 种 外 围 设备 和 主 存储 
器 之 间 的 数据 交换 。 输 入 设备 (如 键盘 、 鼠 标 、 读 卡 器 、 扫 描 仪 、 语 音 识 别 系统 和 触摸 屏 ) 允 
许 我 们 将 数据 输入 计算 机 。 和 输出 设备 (如 显示 器 、 打 印 机 、 绘 图 仪 和 扬声器 ) 允许 我 们 从 计算 
机 获取 信息 。 

输入 /输出 设备 通常 并 不 与 CPU 直接 相连 ， 而 是 采用 某 种 接口 来 处 理 数 据 交换 。 接 口 负责 
系统 总 线 和 各 外 围 设 备 之 间 的 信号 转换 ， 将 信号 变 成 总 线 和 外 设 都 可 以 接受 的 形式 。CPU 通过 
LO 寄存 器 和 外 设 进行 通信 ， 这 种 数据 交换 通常 有 两 种 工作 方式 。 在 存储 器 映射 VO 方式 中 ， 
接口 中 的 寄存 器 地 址 就 在 内 存 地 址 的 分 配 表 ( 或 称 为 映射 图 ) 中 ， 而 且 在 访问 存储 器 和 IO 设备 
之 间 没 有 真正 的 区 别 。 显 然 ， 从 速度 的 角度 来 看 这 是 有 利 的 ， 但 是 它 占 用 了 系统 中 的 存储 器 空 
间 。 使 用 基于 指令 的 VO 方式 ，CPU 有 执行 输入 和 输出 的 专用 指令 。 虽 然 这 不 使 用 内 存 空 间 ， 
但 它 需要 特定 的 IO 指令 ， 这 意味 着 它 只 能 由 可 以 执行 这 些 特定 指令 的 CPU 来 使 用 。 中 断 在 
LO 中 扮演 了 非常 重要 的 角色 ， 因 为 中 断 可 以 通知 CPU 输入 或 输出 是 否 已 经 准备 就 绪 ， 所 以 它 
是 一 种 非常 有 效 的 方法 。 我 们 在 第 7 章 详细 探讨 这 些 0 方法 。 
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4.6 存储 器 的 组 成 和 寻 址 方式 
我 们 在 第 3 章 中 看 到 了 一 个 小 的 内 存 示例 。 在 本 章 中 ,我 们 继续 以 非常 小 的 内 存 为 例 ( 小 
到 我 们 认为 将 它 放 在 现代 计算 设备 上 都 是 可 笑 的 ) 。 但 是 ， 较 小 的 存储 器 使 得 数字 易于 管理 ， 
我 们 在 本 章 讨 论 的 原则 适用 于 小 型 和 大 型 存储 器 。 这 些 原则 包括 如 何 设计 存储 器 和 如 何 编 址 。 
我 们 需要 先 充 分 了 解 下 面 这 些 概 念 。 
可 以 将 存储 器 设想 成 一 个 数据 位 的 矩阵 ， 抢 阵 的 每 一 行 都 由 寄存 器 来 实现 ， 其 长 度 通常 等 
于 机 器 可 寻 址 单元 的 大 小 。 每 个 寄存 器 ( 通常 称 为 存储 位 置 ) 都 具有 一 个 唯一 的 地 址 编号 ， 存 
储 器 的 地 址 通常 是 从 0 开始 编号 的 ， 并 按 顺 序 递增 。 图 4-4 说 明了 这 个 概念 。 
编 址 地 一 一 一 8 位 一 一 > 
Dll ed yh me 
el 
pele neh ae 
ol ea 


le | 
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a ) N 个 8 位 存储 器 单元 b ) N 个 16 位 存储 器 单元 
图 4-4 


存储 器 地 址 几乎 都 是 采用 无 符号 整数 来 表示 的 。 在 第 2 章 中 提 到 ,4 位 是 半 字 节 ， 而 8 位 
是 一 个 字 节 。 通 常 ， 存 储 器 是 按 字 节 编 址 的 ， 这 意味 着 每 个 单独 的 字 节 具有 一 个 唯一 的 地 址 。 
一 些 机 器 的 字 大 小 是 大 于 单个 字 节 的 。 例 如 ， 计 算 机 可 以 处 理 32 位 字 ，( 这 意味 着 它 可 以 通过 
各 种 指令 一 次 处 理 32 位 ， 并 且 使 用 32 位 寄存 器 。) 但 是 它 仍 然 按 字 节 编 址 。 在 这 种 情况 下 ， 当 
一 个 字 使 用 多 个 字 节 时 ， 最低 地址 的 字 节 确定 整个 字 的 地 址 。 当 然 计算 机 也 可 以 是 按 字 编 址 
的 ， 这 意味 着 每 个 字 ( 不 是 每 个 字 节 ) 都 具有 唯一 地 址 ,但 是 现在 大 多 数 机 器 是 按 字 节 编 址 的 
(即使 它们 具有 32 位 或 更 大 的 字 ) 。 存 储 器 地 址 通常 存储 在 单一 机 器 字 中 。 

计算 机 通过 字 节 寻 址 可 以 寻 址 到 不 同 大 小 的 字 ， 如 果 你 对 这 种 说 法 还 不 明白 的 话 ， 那 么 以 
下 类 比 可 能 对 你 有 帮助 。 内 存 类 似 于 一 个 布 满 建筑 物 的 街道 。 每 栋 建 筑 ( 字 ) 有 多 个 公寓 ( 字 
节 ) ， 每 个 公寓 都 有 自己 的 地 址 。 所 有 公寓 都 按 顺序 编号 ( 编 址 ) ， 从 0 到 所 有 公寓 总 数 减 去 1。 
建筑 本 身 将 公寓 分 组 。 在 计算 机 中 ， 字 做 同样 的 事情 。 字 是 各 种 指令 使 用 的 基本 单位 。 例 如 ， 
即使 在 字 节 寻 址 的 机 器 上 ， 也 可 以 从 存储 器 读 取 字 或 向 存储 器 写 人 字 。 

如 果 计 算 机 采用 按 字 节 编 址 的 体系 结构 ， 并 且 指 令 系统 的 结构 字 长 大 于 1 字 节 ， 则 必须 解 
决 对 齐 的 问题 。 例 如 ， 如 果 我 们 希望 在 按 字 节 编 址 的 计算 机 上 读 取 32 位 长 的 字 ， 我们 必须 确 
保 字 存储 在 自然 对 齐 边 界 上 ， 并 且 访 问 从 该 边界 开始 。 在 字 长 32 位 的 情况 下 ， 这 是 通过 使 地 
址 为 4 的 倍数 来 实现 的 。 一 些 结构 允许 某 些 指 令 执 行 未 对 齐 访问 ， 它 的 期 望 地 址 不 必 在 自然 边 
界 上 开始 。 

存储 器 由 随机 存 取 存储 器 (RAM ) 芯片 构成 。( 我 们 将 在 第 6 章 详细 讨论 存储 器 。) 存储 器 通 
常 使 用 符号 LxW( 长 x 宽 ) 来 表示 。 例 如 ，4M x 8 表示 存储 器 是 4M 长 ( 它 具 有 4M =2? x2” = 
2” 个 单元 ) ， 每 个 单元 是 8 位 宽 ( 也 就 是 每 个 单元 是 一 个 字 节 )。 为 了 寻 址 这 个 存储 器 (假设 使 
用 字 节 寻 址 )， 我 们 需要 能 够 唯一 地 识别 2” 个 不 同 的 单元 ， 这 意味 着 我 们 需要 2” 个 不 同 的 地 
址 。 因 为 地 址 是 无 符号 二 进 制 数 ， 所 以 用 二 进 制 计数 0 ~ (2”- 1) 。 这 需要 多 少 位 ? 用 二 进 制 
计数 从 0 ~3( 共 4 个 单元 ) ， 需 要 2 位 。 为 了 以 二 进 制 计数 从 0 ~7( 总 共 8 个 单元 ) ， 我 们 需要 3 
位 。 要 用 二 进 制 计 数 从 0 ~15( 总共 16 个 单元 ) ， 需 要 4 位。 根据 以 上 的 规律 ,我 们 是 否 可 以 填 
写 表 4-1 标注 “?” 的 地 方 ? 












表 4-1 计算 所 需 的 寻 址 位 











缺少 表 项 的 正确 答案 是 5 位 。 当 计算 存储 器 地 址 必须 使 用 多 少 位 时 ， 重 要 的 不 是 可 寻 址 单 
元 的 长 度 ， 而 是 可 寻 址 单元 的 数量 。4M 内 存 需要 22 位 存储 器 地 址 ， 因 为 大 多 数 存储 器 是 按 字 
节 寻 址 的 ， 所 以 我 们 需要 N 位 来 唯一 地 寻 址 每 个 字 节 。 通 常 ， 如 果 计 算 机 具有 2" 个 可 寻 址 存 
储 器 单元 ， 则 它 需 要 N 位 来 唯一 寻 址 每 个 单元 。 

为 了 更 好 地 说 明 字 和 字 节 之 间 的 差别 ， 假 设 在 前 面 例子 中 提 到 的 4M x 8 存储 器 是 按 字 寻 
址 的 而 不 是 按 字 节 寻 址 的 ， 并 且 每 个 字 长 是 16 位。 有 2” 个 字 节 ， 这 意味 着 有 2*/2 = 22 个 字 ， 
这 将 需要 21 位 ， 而 不 是 22 位 。 每 个 字 包 含 两 个 字 节 ， 但 是 我 们 使 用 低 字 节 地 址 来 表示 整个 字 
的 地 址 。 

虽然 大 多 数 存储 器 是 按 字 节 寻 址 的 并 且 宽 度 是 8 位 ， 但 存储 器 的 宽度 可 以 不 同 。 例 如 ， 一 
个 2K x16 的 存储 器 包含 2" =2048 个 16 位 的 存储 单元 。 这 
种 类 型 的 存储 器 通常 用 于 具有 16 位 字 长 的 按 字 寻 址 的 体系 
结构 中 。 

主 存储 器 通常 会 用 多 个 RAM 芯片 。 因 此 ， 需 要 将 这 些 
芯片 组 合成 所 需 容量 的 单个 存储 器 。 例 如 ， 假 设 你 需要 构建 
一 个 32K x8 按 字 节 寻 址 的 存储 器 ， 但 你 只 有 2K x8 的 RAM 
芯片 。 我 们 可 以 将 芯片 的 16 行 连接 在 一 起 ， 如 图 4-5 所 示 。 

每 个 芯片 寻 址 2K 字 节 。 此 存储 器 的 地 址 必须 有 15 位 
(要 访问 32K =25 x2" 字 节 )。 但 每 个 芯片 只 需要 11 个 地 址 
线 (每 个 芯片 只 有 2" 字 节 )。 在 这 种 情况 下 ,需要 译 码 器 来 ”图 4-5 组 合 RAM 芯片 作为 存储 器 
解码 地 址 的 最 左边 或 最 右边 的 4 位 以 确定 哪个 芯片 保存 请 求 的 数据 。 一 旦 定位 了 适当 的 芯片 
后 ， 剩 余 的 11 位 用 于 确定 该 芯片 上 的 偏 移 。 我 们 使 用 最 左边 的 4 位 还 是 最 右边 的 4 位 取决 于 
内 存 是 如 何 交叉 存 取 的 。( 注意 ; 如 果 这 个 存储 器 是 按 字 编 址 的 ， 假 设 字 长 为 16 位 ， 那 么 这 台 
机 器 的 地 址 只 有 14 位 ， 我 们 也 可 以 使 用 8 行 2 个 RAM 芯片 来 构建 一 个 16K x16 的 内 存 ) 。 

单个 存储 器 模块 只 能 品行 访问 (每 次 只 能 执行 一 次 存储 器 访问 ) 。 交 叉 存储 器 可 以 缓解 这 个 问 
题 ， 它 把 存储 器 分 成 多 个 存储 模块 (或 存储 体 ) ， 其 中 多 个 模块 可 以 同时 访问 。 模 块 的 数量 取决 于 
有 多 少 个 可 寻 址 单元 ， 而 不 是 每 个 可 寻 址 单元 的 大 小 。 在 访问 每 个 模块 时 将 返回 一 个 字 ， 它 表示 
了 该 架构 可 寻 址 单元 的 长 度 ， 如 果 存 储 器 是 8 路 交叉 ， 则 可 使 用 8 个 模块 实现 存储 器 ， 编 号 为 
0 ~7。 在 低位 交叉 时 ， 地 址 的 低位 用 于 选择 模块 ， 在 高 位 交叉 时 ， 使 用 地 址 的 高 位 选择 模块 。 

假设 我 们 有 一 个 由 8 个 模块 组 成 的 按 字 节 寻 址 的 存储 器 ， 每 个 模块 有 4 字 节 ， 这 个 存储 器 
总 共有 32 字 节 的 。 我 们 需要 5 位 来 唯一 地 标识 每 个 字 节 。 其 中 3 位 用 于 确定 模块 (因为 有 2 =8 
个 模块 ) ， 剩 下 的 两 位 用 于 确定 该 模块 内 的 偏 移 。 最 直观 的 组 织 高 位 交叉 编 址 用 于 分 配 地 址 ， 
使 每 个 模块 包含 连续 的 地 址 ， 如 图 4-6a 所 示 的 32 个 地 址 。 模 块 0 包含 存储 在 地 址 0、1、2 和 3 
中 的 数据 ; 模块 1 包含 存储 在 地 址 4、5 、6 和 7 中 的 数据 ， 等 等 。 图 4-6b 表示 了 使 用 高 位 交叉 
编 址 时 该 存储 器 的 地 址 结构 。 即 地 址 的 前 三 位 用 于 确定 存储 器 模块 ， 而 剩余 的 两 位 用 于 确定 模 
块 内 的 偏 移 。 图 4-6c 给 出 了 第 一 个 和 第 二 个 模块 高 位 交叉 编 址 的 更 详细 的 视图 。 考 虑 地 址 3， 
它 在 二 进 制 ( 用 5 位 表示 ) 中 是 00011。 高 位 交叉 编 址 使 用 最 左边 的 3 位 (000) 来 确定 模块 (因此 
地 址 3 的 数据 在 模块 0 中 ) 。 剩 余 的 两 位 (11) 告 诉 我 们 所 需 数据 的 偏 移 量 是 3(11, 是 十 进 制 什 
3) ， 即 模块 0 的 最 后 一 个 地 址 。 
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c ) 前 两 个 模块 
图 4-6 


低位 交叉 编 址 存储 器 在 不 同 的 存储 器 模块 中 放置 连续 的 存储 器 地 址 。 图 4-7 显示 了 32 个 地 址 
的 低位 交叉 编 址 。 我 们 在 图 4-7b 中 看 到 在 存储 器 中 一 个 地 址 采用 低位 交叉 编 址 的 地 址 结构 。 该 存 
储 器 的 前 两 个 模块 如 图 4-7c 所 示 。 在 该 图 中 ， 我 们 看 到 模块 0 现在 包含 存储 在 地 址 0、8、16 和 
24 中 的 数据 。 为 了 定位 地 址 3(00011) ， 低 位 交叉 编 址 法 使 用 最 右边 的 3 位 来 确定 模块 (指向 模块 
3)， 剩 下 的 两 个 位 00 表示 该 模块 内 的 偏 移 。 可 以 在 图 4-7 所 示 的 模块 3 中 找到 地 址 3。 
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对 于 低位 和 高 位 交叉 编 址 ， 在 上 用 于 识别 模块 的 位 数 ) 和 交叉 阶 次 之 间 存 在 关系 : 4 路 交 
es 2; 8 路 交叉 使 用 k=3; 16 路 交叉 使 用 上 =4。 一 般 来 说 ， 对 于 路 交 又 ,我们 使 用 = 

。( 这 个 关系 在 第 6 章 中 我 们 会 加 强 介绍 。) 

低位 交叉 编 址 和 总 线 更 匹配 ， ee 
完成 之 前 开始 ( 读 和 写 可 以 重 炙 ) 。 例 如 ， 如 果 在 使 用 高 位 交叉 编 址 (存储 在 地 址 0、1、2 和 3 
中 ) 的 存储 器 示例 中 存储 长 度 为 4 的 数组 ， 则 我 们 只 能 顺序 访问 每 个 数组 元 素 ， ER 
存储 在 一 个 模块 中 。 然 而 ， 如 果 使 用 低位 交叉 编 址 (并 且 数 组 存储 在 模块 0、1、2 和 3 中 的 偏 
移 0 处 ) ， 则 可 以 并 行 访问 数组 元 素 ， 因 为 每 个 数组 元 素 在 不 同 的 模块 中 。 

假设 我 们 有 一 个 128 字 的 存储 器 ， 它 是 8 路 低位 交叉 编 址 (请 注意 ， 字 的 大 小 在 
本 例 中 不 重要 ) ， 这 意味 着 它 使 用 8 个 存储 体 。 因 为 8 =22 ， 所 以 我 们 使 用 低 阶 3 位 来 标识 模 
块 。 因 为 有 128 个 字 ， 所 以 每 个 地 址 需要 7 位 (128 =27 ) 。 该 存储 器 中 的 地 址 具有 以 下 结构 


4 位 3 位 
i 
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请 注意 ， 每 个 模块 的 大 小 必须 为 2 。 我 们 可 以 用 两 种 方法 得 出 这 个 结论 。 首 先 ， 如 果 存 储 
器 有 128 个 字 ， 并 且 我 们 有 8 个 模块 ， 则 128/8 =2 /2 =2*( 因此 每 个 模块 保存 16 个 字 ) 。 我 们 
还 可 以 从 地 址 结构 中 看 到 模块 的 偏 移 量 需 要 4 位 ， 因 此 每 个 模块 允许 有 2 = 16 个 字 。 

如 果 例 4. 1 使 用 高 位 交叉 编 址 ， 会 有 什么 变化 ? 我 们 把 这 作为 一 个 练习 。 4 

让 我 们 回 到 图 4-5 所 示 的 存储 器 ， RS et i er 
芯片 (模块 )。 存 储 器 有 32K =2 x2”"=2 个 可 寻 址 单元 (这 里 一 个 单元 代表 一 个 字 节 ) ， 
味 每 个 地 址 需要 用 15 位 来 表示 。 每 个 芯片 保存 2K =2 字 节 ， NE 
移 。 有 16 =2 个 芯片 ， 陆羽 十 要 位 来 消瘦 起 征 。 假设 地 址 001000000100111 使 用 高 位 交叉 编 
址 ， 我 们 使 用 最 左边 的 4 位 来 确定 芯片 ， 剩 下 的 11 位 作为 偏 移 : 

地 址 001000000100111 上 的 数据 在 存储 在 芯片 240010, ) 上 ， 偏 移 量 为 39(00000100111; ) 。 
如 果 我 们 使 用 低位 交叉 编 址 ， 则 最 右边 的 4 位 用 于 确定 芯片 : 

11 位 


11 位 
ram 有 区 
芯片 内 偏 移 量 芯片 内 偏 移 量 
毛 一 1 位 一 扎 1 位 


因此 ， 使 用 低位 交叉 编 址 的 数据 存储 在 芯片 7(01112) 上 ， 偏 移 量 为 258(00100000010, ) 。 

虽然 低位 交叉 编 址 允许 对 存储 器 中 顺序 存储 的 数据 (诸如 ， 数 组 或 者 程序 中 的 指令 ) 进行 
并 发 访问 ， 但 是 高 位 交叉 编 址 更 直观 。 因 此 ， 对 于 本 书 的 其 余部 分 ， 我 们 假设 使 用 的 都 是 高 位 
交叉 编 址 。 

我 们 所 讨论 的 存储 器 概念 非常 重要 ， 并 且 出 现在 其 余 章 节 的 各 个 地 方 ， 特 别 是 在 详细 讨论 
存储 器 的 第 6 章 中 。 要 关注 的 关键 概念 是 : (1) 存储 器 地 址 是 无 符号 二 进 制 值 (虽然 为 了 简化 
表达 我 们 经 常 将 它们 视 为 十 六 进 制 值 ) 。(2) 要 寻 址 的 是 存储 器 单元 数 ， 而 不 是 存储 单元 的 大 
小 ， 它 决定 地 址 的 位 数 。 虽 然 我 们 可 以 用 更 多 的 位 数 来 表示 地 址 ， 但 很 少 这 么 做 ， 因 为 最 小 化 
是 计算 机 设计 的 一 个 重要 思想 。 


4.7 ”中断 
我 们 已 经 介绍 了 深入 理解 计算 机 架构 所 需 的 基本 硬件 信息 : CPU 、 总 线 、 控 制 单元 、 寄 
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存 器 、 时 钟 、LO 和 存储 器 。 然 而 ， 还 有 一 个 负责 处 理 计算 机 的 各 个 部 件 与 处 理 器 之 间 交 互 
的 概念 : 中 断 。 中 断 是 改变 (或 中 断 ) 系 统 中 流程 正常 执行 的 各 种 事件 。 多 种 原因 可 以 触发 
中 断 : 

e 1/0 请 求 

e 出 现 算术 错误 (例如 , 被 0 除 ) 

e 算术 下 溢 或 上 溢 

e 硬件 故障 (例如 ， 存 储 器 奇偶 校 验 错误 ) 

e 用 户 定义 的 中 断 点 ( 比如， 程序 调试 过 程 ) 

e 页 面 错 误 

。 非法 指令 (通常 由 于 指针 问题 引起 ) 

e 其 他 原因 

为 这 些 类 型 的 中 断 ( 称 为 中 断 处 理 ) 执行 的 操作 通常 是 不 同 的 。 告 诉 CPU 已 经 完成 的 VO 
请 求 与 由 于 除 以 0 而 终止 的 程序 有 很 大 不 同 。 但 是 这 些 动作 都 由 中 断 来 处 理 ， 因 为 它们 需要 改 
变 程 序 执行 的 正常 流程 。 

由 用 户 或 系统 发 出 (启动 ) 的 中 断 请求 可 以 是 可 屏蔽 中 断 ( 可 以 被 禁止 或 忽略 ) 或 不 可 屏蔽 
中 断 (高 优先 级 的 中 断 不 能 被 禁止 并 且 必 须 响 应 ) ， 它 可 以 在 指令 内 或 指令 之 间 发 生 ， 可 以 是 
同步 的 (每 次 执行 程序 时 发 生 在 同一 位 置 ) 也 可 以 是 异步 的 (意外 发 生 ) ， 一 旦 中 断 被 执行 可 能 
导致 程序 终止 或 继续 执行 。 中 断 在 4. 9. 2 节 和 第 7 章 中 有 更 详细 的 介绍 。 

现在 我 们 给 出 了 计算 机 系统 所 需 部 件 的 一 般 性 概述 ， 我 们 继续 介绍 一 个 简单 的 但 有 多 重 功 
能 的 架构 来 说 明 这 些 概念 。 


4.8 MARIE 


MARIE 表示 一 个 真正 直观 和 简单 的 计算 机 体系 结构 ， 它 包括 存储 器 (用 于 存储 程序 和 数 
据 ) 和 CPU( 由 一 个 ALU 和 几 个 寄存 器 组 成 ) 。 它 具有 真正 工作 的 计算 机 所 有 必需 的 功能 部 件 。 
我 们 下 面 描述 的 MARIE 体系 结构 将 有 助 于 说 明 本 章 和 前 三 章 的 概念 。 


4. 8. 1 组 织 结构 


MARIE 具有 下 列 特点 : 

。 使 用 二 进 制 数 和 补 码 表示 法 

。 存储 程序 和 采用 固定 的 字 长 度 

。 按 字 ( 不 是 按 字 节 的 ) 编 址 

主 存储 器 的 容量 为 4K 字 ( 即 每 个 地 址 需要 使 用 12 位 二 进 制 数 ) 
16 位 数据 (16 位 字 ) 

16 位 指令 : 4 位 操作 码 和 12 位 地 址 
一 个 16 位 的 累加 器 (AC ) 

一 个 16 位 的 指令 寄存 器 (IR) 

一 个 16 位 的 存储 右 缓 冲 寄存 右 ( MBR ) 
一 个 12 位 的 程序 计数 器 (PC ) 

一 个 12 位 的 存储 器 地 址 寄存 器 (MAR ) 
一 个 8 位 的 输入 寄存 器 

一 个 8 位 的 输出 寄存 器 

图 4-8 是 MARIE 体系 结构 的 示意 图 。 








控制 单元 





存储 器 地 址 4K-1 
图 4-8 MARIE 的 体系 结构 


我 们 要 再 次 强调 一 个 关于 存储 器 的 重要 问题 。 在 第 3 章 中 ,我 们 介绍 了 一 个 使 用 D 触发 器 
构建 的 简单 存储 器 。 再 次 强调 ， 存 储 器 中 的 每 个 存储 单元 都 有 一 个 唯一 的 地 址 (用 二 进 制 表 
示 )， 并 且 每 个 存储 单元 可 以 存放 一 个 值 。 表 示 存 储 单元 地 址 的 二 进 制 数 常常 很 容易 与 存储 单 
元 中 存放 的 内 容 混 淆 。 为 了 避免 混乱 假设 有 一 个 邮局 ， 它 的 里 面 有 各 种 “地 址 ”或 数字 的 
邮箱 。 邮 箱 里 面 有 邮件 。 要 想 获 得 邮件 ， 必 须知 道 邮 箱 的 号 码 。 对 于 需要 从 存储 器 中 取 回 的 数 
据 或 指令 也 是 如 此 。 任 何 存储 器 地 址 中 的 内 容 都 是 通过 指定 该 存储 器 位 置 的 地 址 来 控制 的 。 我 
们 可 以 看 到 有 很 多 不 同 的 方法 来 指定 这 个 地 址 。 


4.8.2 寄存 器 和 总 线 

寄存 器 是 CPU 内 的 存储 位 置 (如 图 4-8 所 示 )。CPU 的 ALU 部 分 执行 所 有 处 理 (算术 运算 、 
逻辑 判定 等 ) 。 当 执行 程序 时 ， 寄 存 器 用 于 特定 的 目的 : 它们 保存 临时 存储 的 值 、 以 某 种 方式 
操作 的 数据 或 简单 计算 的 结果 。 很 多 时 候 ， 寄 存 器 隐 含 地 引用 在 指令 中 ,我们 在 4. 8. 3 节 描 述 
的 MARIE 指令 集中 ， 可 以 看 到 这 种 情况 。 

在 MARIE 中 ， 有 下 列 7 种 寄存 器 : 

se。 AC: 累加 器 用 来 保存 数据 值 。 它 是 一 个 通用 寄存 器 ， 作 用 是 保存 CPU 需要 处 理 的 数 
据 。 现 在 大 部 分 的 计算 机 都 有 多 个 通用 寄存 器 。 

MAR: 存储 器 地 址 寄存 器 用 来 保存 所 引用 数据 的 存储 器 地 址 。 

MBR: 存储 器 缓冲 寄存 器 用 来 保存 刚 从 存储 器 中 读 取 或 者 将 要 写 人 存储 器 中 的 数据 。 
PC: 程序 计数 器 用 来 保存 程序 将 要 执行 的 下 一 条 指令 的 地 址 。 

IR: 指令 寄存 器 用 来 保存 将 要 执行 的 下 一 条 指令 。 

InREG : 输入 寄存 器 用 来 保存 来 自 输入 设备 的 数据 。 

OutREG : 输出 寄存 器 用 来 保存 要 输出 到 输出 设备 的 数据 。 

MAR、MBR 、PC 和 IR 用 来 保存 一 些 专用 信息 ， 并 且 不 能 用 作 上 述 规定 之 外 的 其 他 目的 。 
例如 ， 我 们 不 能 在 PC 中 存储 来 自 存 储 器 的 任意 数据 。 我 们 必须 使 用 MBR 或 AC 来 存储 这 个 任 
意 值 。 男 外 ， 还 有 保存 各 种 指示 信息 的 状态 或 标志 寄存 器 ， 比 如 ALU 中 的 溢出 、 算 术 或 逻辑 
运算 的 结果 是 否 为 零 、 在 计算 中 是 否 使 用 进位 位 、 结 果 是 否 为 负 等 。 但 是 为 了 清楚 起 见 ， 我 们 
不 在 任何 图 中 明确 地 包括 该 寄存 器 。 

MARIE 是 一 个 非常 简单 的 计算 机 ， 在 它 的 寄存 器 组 中 寄存 器 数目 有 限 。 现 代 CPU 具有 多 个 
通用 寄存 器 ， 通 常 称 为 用 户 可 见 寄存 器 ， 其 执行 类 似 于 AC 的 功能 。 现 在 计算 机 还 有 额外 的 寄存 
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器 ， 例 如 ,一些 计算 机 具有 可 将 数据 移 位 的 寄存 器 和 其 他 一 些 寄存 器 ， 如 果 把 这 些 寄存 器 组 合 到 
一 起 ， 可 以 将 其 视 为 各 种 数据 值 的 列表 。 总 线 

MARIE 不 能 在 没有 总 线 的 情况 下 将 数 
据 或 指令 传人 或 传 出 寄存 器 。 我 们 假设 MA- 
RIE 有 一 个 公共 总 线 。 连 接 到 总 线 上 的 每 个 
设备 都 有 一 个 编号 ， 在 设备 可 以 使 用 总 线 之 
前 ， 必 须 将 其 设置 为 该 编号 。 我 们 还 可 以 通 
过 一 些 路 径 来 加 快 执 行 速度 。 在 MAR 和 存 
储 器 之 间 具 有 通信 路 径 ( MAR 用 于 提供 存储 
器 地 址 线 的 输入 ， 使 CPU 知道 在 存储 器 中 
读 取 或 写 人 的 位 置 ) 以 及 从 MBR 到 AC 有 单 
独 路 径 。 还 有 从 MBR 到 ALU 的 特殊 路 径 ， 
它 人 允许 在 算术 运算 中 使 用 MBR 中 的 数据 。 
信息 还 可 以 从 AC 通过 ALU 返回 到 AC 中 ， 
而 不 用 通过 公共 总 线 。 使 用 这 些 附加 路 径 的 
好 处 在 于 ， 在 同一 个 时 钟 周期 内 数据 被 放置 
在 这 些 附加 路 径 上 的 同时 会 将 另外 一 些 信息 
放 在 公共 总 线 上 ， 从 而 允许 这 些 事件 并 行 发 
生 。 图 4-9 显示 了 MARIE 中 的 数据 路 径 ( 信 
息 流 过 的 路 径 ) 。 


4. 8. 3 “指令 集 架构 NE z 
MARIE 有 一 个 非常 简单 但 功能 强大 的 WO 
指令 集 。 机 器 的 指令 集 架 构 (ISA ) 指定 了 计算 机 可 以 执行 的 指令 及 其 格式 。ISA 本 质 上 是 软件 
和 硬件 之 间 的 接口 有 些 机 器 的 指令 集 架构 包括 几 百 个 指令 。 我 们 前 面 提 到 ，MARIE 的 每 条 指 
令 由 16 位 组 成 。 最 高 的 4 位 (12 ~15 位 ) 构 成 要 执行 指令 的 操作 码 ( 其 允许 一 共有 16 个 指令 )。 
低 12 位 (0~11 位) 形成 一 个 地 址 ， 这 个 地 址 a 
多 许 的 最 大 存储 天 地 址 为 29-1。MARIE 的 
指令 格式 如 图 4-10 所 示 。 位 15 12 11 0 
大 多 数 ISA 包含 的 指令 有 : 处 理 数 据 的 图 4-10 MARIE 的 指令 格式 
指令 、 移 动 数据 的 指令 和 控制 程序 执行 顺序 的 指令 。MARIE 的 指令 集 由 表 4-2 所 示 的 指令 组 成 。 


[er 





表 4-2 MARIE 的 指令 集 



















0001 1 Load X 将 地 址 为 X 的 存储 单元 中 的 内 容 装 入 AC 

0010 2 Store x 将 Ac 中 的 内 容 存储 到 地 址 为 x 的 存储 单元 中 

0011 3 Add x 将 地 址 xX 中 的 内 容 和 AC 中 的 内 容 相 加 ， 然 后 将 结果 存 入 AC 中 
0100 4 Subt Xx 将 Ac 中 的 内 容 减 去 地 址 X 中 的 内 容 ， 然 后 将 结果 存 入 Ac 中 
0101 5 Input 从 键盘 输入 一 个 数值 到 AC 中 

0110 6 Output 将 AC 中 的 数值 输出 到 显示 器 

QT Halt 终止 程序 的 执行 

1000 8 Skipcond 有 条 件 地 跳 过 下 一 条 指令 

1001 9 Jump X 将 和 的 值 装 入 到 PC 中 
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Load 指令 的 作用 是 将 数据 从 存储 器 送 到 CPU( 通 过 MBR 和 AC ) 。 来 自 存储 器 的 所 有 数据 
(所 有 不 是 指令 的 数据 ) 必须 首先 送 到 MBR 中 ， 然 后 再 送 到 AC 或 ALU 中 ; 在 这 个 架构 中 没有 
其 他 数据 传输 方案 。 注 意 ，Loada 指令 不 必 将 AC 命名 为 目的 操作 数 ; 这 个 寄存 器 (AC ) 是 隐 含 
在 这 条 指令 中 的 。 其 他 指令 以 类 似 的 方式 引用 AC 寄存 器 。Store 指令 的 作用 是 将 数据 从 CPU 
送 回 到 存储 器 。aAdd 和 subt 指令 分 别 将 在 地 址 X 处 找到 的 数据 值 与 AC 中 的 值 相 加 或 相 减 。 
位 于 地 址 X 中 的 数据 复制 到 MBR 中 ， 并 且 一 直 保 持 到 算术 运算 执行 完 。Input 和 Output 可 
以 实现 MARIE 与 外 界 通 信 。 

输入 和 输出 是 比较 复杂 的 操作 。 在 现代 计算 机 中 ， 输 入 和 输出 是 通过 ASCII 编码 字符 的 方 
式 完 成 的 。 这 意味 着 如 果 在 键盘 上 键入 数字 32， 它 实际 上 是 先 读 人 ASCII 字符 “3” 然 后 再 读 
入 ASCI 字符 “2”。 这 两 个 字符 必须 转换 为 数值 32， 才 能 放 到 寄存 器 AC 中 。 因 为 我 们 主要 关 
心计 算 机 如 何 工作 ， 所 以 假定 从 键盘 输入 的 值 是 自动 正确 转换 的 。 这 种 假定 实际 上 掩饰 了 一 
非常 重要 的 观念 : 计算 机 怎么 知道 把 IO 值 当 作 数 字 还 是 ASCI 来 处 理 ? 如 果 输 入 或 输出 的 内 
容 实际 上 是 ASCII[， 那 么 怎么 办 ? 答案 是 计算 机 是 通过 该 值 的 上 下 文 如 何 使 用 它 来 识别 的 。 在 
MARIE 中 ， 我 们 假设 只 有 数字 输入 和 输出 。 我 们 还 允许 输入 的 数值 是 十 进 制 数 ， 并 假设 有 一 
个 “魔术 转换 ”将 输入 的 十 进 制 数 转换 为 计算 机 实际 存储 的 二 进 制 值 。 实 际 上 ， 如 果 计 算 机 
正常 工作 ， 这 些 问 题 都 能 解决 。 

Halt 命令 使 当前 程序 终止 执行 。Skipcona 指令 允许 执行 条 件 分 支 (就 像 “while” 循 环 
或 “if” 语 句 一 样 )。 当 执行 Skipcona 指令 时 ， 必 须 检查 存储 在 AC 中 的 值 。 两 个 地 址 位 ( 假 
设 我 们 总 是 使 用 最 接近 操作 码 字 段 的 两 个 地 址 位 ， 即 第 10 和 第 11 位 ) 指 定 要 测试 的 条 件 。 如 
果 两 个 地 址 位 为 00， 则 这 条 指令 解释 为 “如 果 AC 为 负 则 执行 跳 转 ” 。 如 果 两 个 地 址 位 为 01 
(第 11 位 为 0 且 第 10 位 为 1) ， 则 这 条 指令 解释 为 “如 果 AC 等 于 0 则 执行 跳 转 ” 。 最 后 ， 如 果 
两 个 地 址 位 为 10( 或 2) ， 则 这 条 指令 解释 为 “如 果 AC 大 于 0 则 执行 跳 转 ” 。 “Skip” 只 是 跳 过 
下 一 条 指令 。 这 是 通过 将 PC 增加 1 来 实现 的 ， 实 际 上 就 是 忽略 了 接 下 来 的 指令 ， 不 再 对 这 条 
指令 执行 取 指 操作 。Jump 指令 是 无 条 件 分 支 指令 ， 它 也 影响 PC。 该 指令 使 PC 的 内 容 被 蔡 换 
为 的 值 ， 作 为 下 一 个 指令 要 取 的 地 址 。 

我 们 希望 保持 体系 结构 和 指令 集 尽 可 能 简单 ， 但 是 还 要 传达 理解 计算 机 工作 原理 所 需 的 信 
息 。 因 此 ， 这 里 我 们 省 略 了 几 个 有 用 的 说 明 。 但 是 ， 很 快 你 会 发 现 ， 这 个 指令 集 还 是 相当 强大 
的 。 一 旦 熟悉 了 机 器 的 工作 原理 ， 就 可 以 对 指令 集 进 行 扩展 ， 这 样 可 以 使 编程 更 简单 。 

下 面 来 研究 MARIE 使 用 的 指令 格式 。 假 设 我 们 有 以 下 形式 的 16 位 指令 : 

最 左边 的 4 位 表示 操作 码 ， 也 就 是 要 执行 的 指令 。 操作 码 地 址 
0001 是 1 的 二 进 制 表示 ， 表 示 Load 指令 。 剩 余 的 12 位 表 
示 正 在 加 载 的 值 的 地 址 ， 这 里 是 主 存储 器 的 第 三 个 地 址 。 oo Lololololololalalalol 
这 个 指令 将 主 存 储 器 中 地 址 为 3 的 存储 单元 的 数据 复制 到 
AC 中 。 下 面 讨论 另 一 个 指令 。 

最 左边 的 4 位 为 0011 也 就 是 十 进 制 数 3， 表 示 Ada 指令 。 地 址 位 是 十 六 进 制 地 址 00D( 或 


十 进 制 数 13 ) 。 这 条 指令 的 意义 是 在 主 存储 器 地 址 为 00D 的 存储 单元 中 获取 数据 ， 并 将 这 个 值 
与 AC 中 的 值 相 加 。 和 再 放 回 到 AC 中 ,替代 AC 中 原来 的 数值 。 再 看 下 面 一 个 例子 : 








| 操作 码 | 操作 码 
a i 
位 151413121110987654 位 1514131211109876543210 


该 指令 的 操作 码 表示 Skipcond 指令 。 第 10 位 和 第 11 位 (从 左 到 右 读 取 ， 或 者 说 第 11 位 
跟随 第 10 位 ) 为 10 ， 表 示 数 值 2。 这 意味 着 “如 果 AC 大 于 0 则 执行 跳 转 ” 。 如 果 AC 中 的 值 小 
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于 或 等 于 0， 则 该 指令 被 忽略 ,程序 继续 执行 下 一 条 指令 。 如 果 AC 中 的 值 大 于 0， 则 此 指令 会 
使 PC 中 的 值 加 1， 从 而 导致 程序 中 紧 跟 这 条 指令 的 下 一 条 指令 被 忽略 (在 阅读 后 面 有 关 指 令 周 
期 时 必须 注意 这 一 点 ) 。 

这 些 例子 中 最 令 人 感 兴趣 的 是 ,我 们 将 使 用 这 些 有 限 的 指令 集 编写 程序 。 你 是 喜欢 使 用 
Load、Add 和 Halt 命令 还 是 与 它们 等 效 的 二 进 制 0001 、0011 和 0111 编写 一 个 程序 呢 ? 大 多 
数 人 喜欢 使 用 指令 名 称 或 助 记 符 ， 而 不 是 指令 的 二 进 制 数 。 二 进 制 指令 称 为 机 器 指令 。 相 应 的 
助 记 符 指令 则 称 为 汇编 语言 指令 。 在 汇编 语言 和 机 器 指令 之 间 有 一 一 对 应 的 关系 。 当 我 们 键 人 
汇编 语言 程序 (即使 用 表 4-2 所 列 出 的 指令 ) 时 ， 我 们 需要 一 个 汇编 器 将 其 转换 为 对 应 的 二 进 制 
命令 。 我 们 会 在 4. 11 节 讨 论 汇编 锅 。 


4.8.4 寄存 器 传输 表示 


我 们 已 经 看 到 ， 数 字 计 算 机 系统 包括 许多 组 件 ， 其 中 有 算术 逻辑 单元 、 寄 存 器 、 存 储 器 、 
译 码 器 和 控制 单元 。 这 些 单元 通过 总 线 互相 连接 ， 各 种 信息 可 以 通过 总 线 在 系统 中 传递 。 在 前 
面部 分 MARIE 呈现 的 指令 集 实 际 上 就 是 用 这 些 部 件 来 执行 程序 的 一 组 机 器 级 指令 。 每 个 指令 
看 起 来 很 简单 ， 但 是 ， 如 果 仔 细 研 究 这 些 指令 在 部 件 级 别 上 的 实际 执行 过 程 ， 就 会 发 现 每 个 指 
令 都 涉及 多 个 操作 。 例 如 ，Load 指令 将 给 定 存储 器 位 置 中 的 内 容 加 载 到 AC 寄存 器 中 。 但 是 ， 
如 果 我 们 观察 在 部 件 级 发 生 了 什么 ， 那 么 我 们 会 看 到 正在 执行 多 个 “ 微 指令 ”。 首 先 ， 来 自 指 
令 的 地 址 必须 加 载 到 MAR 中。 然后 ,该 内 存 位 置 中 的 数据 必须 加 载 到 MBR 中 。 然 后 MBR 必 
须 加 载 到 AC 中 。 这 些微 指令 称 为 微 操 作 。 微 指令 规定 了 对 寄存 器 中 存储 的 数据 执行 的 基本 
操作 。 

描述 微 操作 行为 的 符号 表示 法 称 为 寄存 器 传输 表示 法 ( RTN ) 或 称 为 寄存 器 传输 语言 
( RTL)。 我 们 使 用 符号 ML Xj] 来 表示 存储 在 存储 器 位 置 X 中 的 实际 数据 ， 而 符号 二 表示 信息 的 
传送 。 实 际 上 ， 从 一 个 寄存 器 传送 到 另 一 个 寄存 器 总 是 涉及 从 源 寄存 器 传送 到 总 线 ， 然 后 从 总 
线 传送 到 目的 寄存 器 。 然 而 ， 为 了 清楚 起 见 ， 我 们 不 包括 这 些 总 线 传送 过 程 ， 假 设 您 已 经 了 解 
了 数据 传送 必须 涉及 总 线 周 期 。 

下 面 介 绍 在 MARIE 的 指令 集 架 构 中 每 个 指令 提供 的 寄存 器 传输 表示 法 。 

Load X 

该 指令 将 存储 单元 X 中 的 内 容 加 载 到 AC 中 。 然 而 ， 地 址 X 必须 首先 放 入 MAR。 然 后 将 位 
置 ML MAR ] (或 地 址 X) 处 的 数据 移动 到 MBR 中 。 最 后 ， 这 个 数据 转移 到 AC 寄存 器 中 。 


MAR CX 
MBR ¢- MI[MAR] 
AC € MBR 


在 地 址 X 处 数据 被 装 入 MBR 之 前 ,指令 寄 存 器 (IR) 需 要 使 用 总 线 来 将 X 的 值 复制 到 
MAR， 所 以 该 操作 需要 两 个 总 线 周 期 。 很 明显 ， 这 两 个 操作 分 别 属于 不 同 的 操作 线路 ， 这 表示 
它们 不 能 在 同一 总 线 周期 内 发 生 。 然 而 ， 因 为 我 们 在 MBR 和 AC 之 间 设 置 了 专门 的 连接 通路 ， 
所 以 从 MBR 到 AC 的 数据 传输 可 以 在 数据 放 入 MBR 之 后 立刻 进行 ， 不 必 等 待 总 线 周 期 。 

Store X 

该 指令 将 AC 中 的 内 容 存 储 到 存储 单元 X 中 : 

MAR 《人 X, MBR ¢€ AC 

MI[MAR] ¢€ MBR 

Add X 

存储 在 地 址 X 中 的 数据 值 加 到 AC 累加 器 中 。 指 令 的 执行 过 程 如 下 所 示 : 





MAR ¢- X 

MBR ¢- MI[MAR] 

AC 全 AC + MBR 

Subt X 

与 Add 指令 相似 ， 该 指令 从 累加 器 中 减 去 存储 在 地 址 X 处 的 数值 ， 并 将 结果 放 回 AC 中 : 

MAR < X 

MBR ¢- MI[IMAR] 

AC ¢ AC - MBR 

Input 

这 条 指令 的 功能 是 将 来 自 输入 设备 的 任何 输入 先 放 到 InREG 寄存 器 中 。 然 后 再 将 数据 转 
移 到 AC 中 。 


AC € InREG 


Output 
这 条 指令 将 AC 的 内 容 先 放 到 OutREG 寄存 器 中 ， 然 后 将 其 发 送 到 输出 设备 。 


OutREG ¢- AC 


Halt 
不 对 寄存 器 执行 任何 操作 ， 该 机 器 只 是 停止 程序 的 执行 。 
Skipcond 
回想 一 下 可 知 ， 该 指令 使 用 地 址 字段 中 第 10 位 和 第 11 位 来 确定 在 AC 上 执行 何 种 比较 运 
算 。 根 据 这 个 位 组 合 ， 检 查 AC 以 查看 其 是 否 小 于 0、 等 于 0 或 大 于 0。 如 果 给 定 条 件 为 真 ， 则 
跳 过 下 一 指令 。 这 是 通过 将 PC 寄存 器 增加 1 来 实现 的 。 
If IR[11-10] = 00 then {if bits 10 and 11 in the IR are both 0} 
IE AC < 0 then BC ¢- PC+1 
else IE IRIIL-a0] =\01 then {if bit 11 = 0 anampiE 10 = 1} 
If AC = 0 then PC ¢- PC+1 


else IE IR[11-10] = 10 then {if bit 11 = 1 and bit 10 = 0} 
IE AC > 0 then PC 全 PC+1 


如 果 第 10 位 和 第 11 位 都 是 1， 则 会 产生 一 个 错误 条 件 。 当 然 ， 也 可 以 使 用 这 两 位 都 是 1 
来 定义 另外 一 个 条 件 跳 转 。 

Jump X 

该 指令 执行 一 个 转向 给 定 地 址 X 的 无 条 件 分 支 转移 。 因 此 ， 为 了 执行 该 指令 ， 地址 X 必 
须 加 载 到 PC 中 。 


PC 《4 X 


实际 上 ， 指 令 寄 存 器 (或 IRII1-0] ) 的 低 12 位 或 最 右边 的 12 位 反映 了 X 的 值 。 因 此 ， 这 
种 传输 可 以 更 准确 地 描述 为 : 


PC € IR[L1=0] 


但 是 ， 也 许 读者 会 觉得 认为 表示 法 PCe-x 更 容易 理解 ， 并 与 实际 指令 相关 联 ， 所 以 一 般 
使 用 这 种 表示 方法 。 

寄存 器 传输 表示 法 (RNT) 属于 一 种 符号 表示 法 。 它 所 表示 的 是 在 执行 特定 的 指令 时 计算 机 
系统 内 部 所 发 生 的 各 种 操作 。 寄 存 器 传输 表示 法 和 数据 通路 有 关 ， 如 果 多 个 微 操作 必须 共享 总 
线 的 话 ， 则 它们 必须 以 顺序 方式 ,一 个 接 一 个 地 执行 。 
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4.9 指令 的 执行 过 程 

我 们 已 经 介绍 了 一 种 基本 的 计算 机 语言 ， 利 用 这 种 语言 可 以 进行 人 机 对 话 ， 现 在 我 们 需要 
确切 地 了 解 一 个 特定 程序 是 怎么 执行 的 。 所 有 计算 机 都 遵循 基本 的 循环 过 程 : 取 指 、 译 码 和 执 
行 周 期 。 


4.9.1 取 指 - 译 码 -执行 周期 

取 指 - 译 码 -执行 周期 表示 计算 机 运行 程序 所 遵循 的 步骤 。CPU 读 取 指令 (从 主 存储 器 传 
送 到 指令 寄存 器 ) ， 对 其 进行 译 码 (确定 操作 码 并 获取 执行 指令 所 需 的 所 有 数据 ) 并 执行 (执行 
指令 所 指示 的 操作 ) 。 注 意 ， 在 这 个 周期 中 很 大 一 部 分 工作 是 将 数据 从 一 个 位 置 复制 到 另 一 个 
位 置 。 当 程序 初始 加 载 时 ， 必 须 将 第 一 条 指令 的 地 址 放 在 PC 中 。 下 面 列 出 了 计算 机 系统 工作 
周期 的 各 个 步骤 ， 即 特定 时 钟 周期 内 发 生 的 各 种 操作 。 注 意 ， 步 又 1 和 步骤 2 构成 了 取 指 过 
程 ， 步 又 3 为 译 码 过 程 ， 步 又 4 是 执行 过 程 。 

1. 将 PC 的 内 容 复 制 到 MAR: MAR<-PC。 

2. CPU 转 到 主 存储 器 并 获取 由 MAR 给 出 的 地 址 中 的 指令 ， 将 该 指令 置 于 IR 中 , 将 PC 增 
加 1(PC 现在 指向 程序 的 下 一 条 指令 ) : 
IR*-M[ MAR] ，PCe-PC +1。( 注 意 : 由 于 
MARIE 是 按 字 编 址 的 ， 所 以 PC 加 1 所 产 
生 的 实际 效果 是 下 一 个 字 的 地 址 将 占据 PC 
寄存 器 ， 如 果 MARIE 是 按 字 节 编 址 的 ， 则 
需要 将 PC 增加 2， 以 指向 下 一 条 指令 的 地 
址 ， 因 为 每 个 指令 将 占用 2 字 节 的 宽度 。 
在 有 32 位 字 的 按 字 节 编 址 的 机 器 上 ， 则 
PC 需要 增加 4。) 

3. 将 IR 的 最 右边 12 位 复制 到 MAR 
中 ， 并 对 IR 最 左边 的 4 位 译 码 以 确定 操作 
码 ，MAR<*-IR[11 -0] 和 译 码 IR[15-12]。 

4. 如 有 必要 ， 将 使 用 MAR 中 的 地 址 
进行 存储 器 访问 以 获取 数据 ， 将 数据 放 和 人 
MBR( 也 可 能 是 AC) 中 ,然后 执行 指令 
MBR4-M[ MAR ] 并 执行 实际 指令 。 

计算 机 执行 程序 的 循环 过 程 可 以 采用 
流程 图 的 形式 来 表示 ， 如 图 4-11 所 示 。 

请 注意 ， 现 在 的 计算 机 即使 有 庞大 的 
指令 集 ， 超 长 的 指令 和 巨大 的 存储 器 系统 ， 
也 可 以 在 瞬 眼 之 间 执 行 数 百 万 次 这 些 取 指 
- 译 码 - 执行 的 循环 过 程 。 


4. 9.2 中断 和 指令 周期 
所 有 计算 机 都 提供 了 一 种 正常 取 指 - 
译 码 -执行 周期 被 中 断 的 方法 。 由 于 许多 图 4-11 取 指 - 译 码 -执行 周期 
原因 必须 要 发 生 中 断 ， 其 中 包括 程序 错误 
(如 除 以 0、 算 术 溢 出 、 堆 栈 溢出 或 尝试 访问 存储 器 的 保护 区 域 ) ;硬件 错误 (如 内 存 奇 偶 校 验 
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错误 或 电源 故障 ) ; LO 完成 ( 当 磁 盘 读 取 请 求 和 数据 传输 完成 时 发 生 的 ) ; 用 户 中 断 ( 如 按 Ctrl- 
C 或 Ctrl- Break 来 停止 程序 ) ; 由 操作 系统 设置 的 定时 器 中 断 ( 如 在 分 配 虚拟 存储 器 或 执行 某 些 
记 账 功能 时 这 是 必需 的 ) 。 所 有 这 些 中 断 都 有 一 些 共同 之 处 : 它们 中 断 取 指 - 译 码 -执行 周期 


的 正常 流程 ， 并 告诉 计算 机 停止 正在 执行 的 
操作 ， 然 后 转 去 执行 其 他 操作 。 这 种 操作 称 
为 中 断 。 

计算 机 处 理 中 断 的 速度 在 确定 计算 机 整 
体 性 能 方面 发 挥 关键 的 作用 。 硬 件 中 断 可 以 
由 系统 上 的 任何 外 设 产 生 ， 包 括 内 存 、 硬 盘 
了 驱动器、 键盘 、 鼠 标 ， 甚 至 调制 解 调 器 。 如 
果 处 理 器 不 使 用 中 断 ， 而 是 定期 轮 询 硬 件 设 
备 ， 看 是 否 有 需要 完成 的 任务 ， 这 会 很 浪费 
CPU 时 间 ， 因 为 更 多 时 候 是 没有 需要 完成 的 
任务 。 中 断 很 好 ， 因 为 它 让 CPU 知道 在 特定 
时 刻 需要 注意 相应 设备 ， 而 不 需要 CPU 不 断 
监视 这 些 设备 。 假 设 你 需要 一 些 具 体 的 信 
息 ， 朋 友和 承 诺 为 你 收集 。 你 有 两 个 选择 ， 定 
期 打 电 话 给 朋友 ( 轮 询 ) ， 如 果 信 息 尚 未 收集 
完 就 会 浪费 你 和 朋友 的 时 间 ; 或 者 等 到 收集 
好 后 ， 请 朋友 打 个 电话 。 当 电话 “中 断 ” 你 
时 ， 你 可 能 正在 与 其 他 人 进行 交谈 ， 但 后 一 
种 方法 是 处 理 信息 交流 的 更 有 效 方法 。 

计算 机 还 响应 由 各 种 软件 应 用 程序 产生 
的 软件 中 断 ( 也 称 为 陷阱 或 异常 )。 现 代 计算 
机 通过 使 用 中 断 处 理 程序 来 支持 软件 和 硬件 
中 断 。 这 些 处 理 程序 就 是 当 相应 的 中 断 检测 
到 来 后 ,执行 的 一 些 简单 例 程 (过 程 )。 这 些 
中 断 及 其 相关 的 中 断 服务 程序 (ISR ) 存储 在 
中 断 向 量 表 中 。 

中 断 是 如 何 与 “ 取 指 - 译 码 - 执行 周 
期 ”的 流程 融 为 一 体 的 呢 ? CPU 完成 当前 执 
行 的 指令 后 ， 在 每 次 取 指 - 译 码 -执行 周期 
开始 时 检查 是 否 有 中 断 发 出 ， 如 图 4-12 所 
示 。 一 旦 CPU 响应 中 断 ， 它 必须 转 去 处 理 
中 断 。 

“处 理 中 断 ” 模 块 的 细节 如 图 4- 13 所 
示 。 无 论 发 生 的 是 什么 类 型 的 中 断 ， 这 个 过 
程 都 是 一 样 的 ， 该 过 程 开 始 于 CPU 检测 到 中 
断 请 求 信号 。 在 做 任何 事情 之 前 ， 系 统 通过 
保存 程序 的 状态 和 变量 信息 来 挂 起 正在 执行 
的 进程 。 然 后 ， 把 触发 中 断 的 设备 ID 或 中 










是 否 有 中 断 请 求 ? 


执行 取 指 - 译 码 - 
执行 周期 





图 4-13 处理 一 个 中 断 
断 请 求 号 作为 索引 去 查询 中 断 向 量 表 ， 该 中 断 向 量 表 通 常 保存 在 存储 空间 的 低地 址 区 域内 。 接 
着 ,查询 中 断 服务 程序 的 入 口 地 址 ( 称 为 地 址 向 量 ) ， 并 将 其 放 人 程序 计数 器 中 ， 从 而 开始 服 
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务 程序 的 执行 ( 即 再 次 恢复 取 指 - 译 码 - 执行 的 循环 ) 。 中 断 服 务 完成 后 ， 系 统 将 恢复 中 断 发 
生前 所 保存 的 正在 运行 的 程序 信息 ， 然 后 继续 执行 ， 除 非 检 测 到 另 一 个 中 断 ， 这 样 又 会 如 前 所 
述 转 去 执行 中 断 。 

可 以 使 用 标志 寄存 器 中 的 特殊 中 断 屏蔽 位 来 暂停 非 关 键 中 断 的 处 理 。 这 称 为 中 断 屏蔽 ,被 
挂 起 的 中 断 称 为 可 屏蔽 中 断 。 不 可 屏蔽 中 断 不 能 暂停 ， 因 为 这 样 做 ， 系 统 可 能 会 进入 不 稳定 或 
不 可 预测 的 状态 。 

汇编 语言 提供 了 使 用 硬件 和 软件 中 断 的 具体 指令 。 在 编写 汇编 语言 程序 时 ， 最 常见 的 任务 
之 一 是 通过 软件 中 断 处 理 IO( 有 关中 断 驱动 VO 的 更 多 信息 ， 请 参见 第 7 章 ) 。 实 际 上 ， 对 于 
编写 汇编 语言 的 新 手 来 说 ， 比 较 复 杂 的 功能 之 一 是 获得 输入 和 编写 输出 ， 主 要 是 因为 这 些 必须 
使 用 中 断 来 完成 。MARIE 通过 避免 使 用 IO 中 断 来 简化 程序 员 对 IO 的 编程 。 


4.9.3 MARIE 的 MO 


LO 处 理 是 计算 机 系统 设计 和 编程 中 最 具 挑 战 性 的 任务 之 一 。 我 们 的 模型 必然 是 简化 的 ， 
我 们 在 此 提供 它 只 是 为 了 完成 MARIE 的 功能 。 

MARIE 有 两 个 寄存 器 来 处 理 输入 和 输出 。 一 个 是 输入 寄存 器 ， 它 保存 从 输入 设备 传送 到 
计算 机 中 的 数据 ; 另 一 个 是 输出 寄存 器 ， 它 保存 准备 发 送 到 输出 设备 的 信息 。 这 两 个 寄存 器 使 
用 的 时 序 非常 重要 。 例 如 ， 如 果 你 从 键盘 输入 ， 并 且 输 入 速度 非常 快 ， 则 计算 机 必须 能 够 读 取 
输入 到 输入 寄存 器 中 的 每 个 字符 。 如 果 计 算 机 在 处 理 完 当 前 字符 之 前 有 机 会 将 另 一 个 字符 输入 
该 寄存 器 ， 则 当前 字符 将 丢失 。 更 可 能 的 是 ， 由 于 处 理 器 的 速度 非常 快 ， 键 盘 输入 非常 慢 ， 处 
理 器 可 能 会 多 次 从 输入 寄存 器 中 读 取 相同 的 字符 。 这 是 我 们 必须 避免 的 两 种 情况 。 

为 了 解决 这 些 问题 ，MARIE 采用 了 一 种 改进 的 程序 控制 WO( 在 第 7 章 中 讨论 ) ， 它 将 所 有 
VO 置 于 程序 员 的 直接 控制 之 下 。MARIE 的 输出 动作 只 是 将 一 个 值 放 在 输出 寄存 器 (OutREG ) 
中 。 该 寄存 器 可 以 由 输出 控制 器 读 取 ， 然 后 该 输出 控制 器 将 其 发 送 到 适当 的 输出 设备 ， 如 终端 
显示 器 、 打 印 机 或 磁盘 。 对 于 输入 ， 作 为 简单 系统 中 最 简单 的 MARIE， 它 将 CPU 置 于 等 待 状 
态 ， 直 到 一 个 字符 输入 到 输入 寄存 器 (InREG ) 。 然 后 将 输入 寄存 器 (InREG ) 复制 到 累加 器 ， 以 
便 随 后 由 程序 员 进行 处 理 。 大 家 应 该 发 现 ， 该 模型 不 提供 并 发 处 理 。 机 器 在 等 待 输入 时 基本 上 
是 空闲 的 。 第 7 章 介绍 了 更 有 效 利 用 机 器 资源 的 其 他 LO 方法 。 


4. 10 ”一 个 简单 的 程序 


我 们 现在 提供 一 个 为 MARIE 编写 的 简单 程序 。 在 4. 12 节 中 ， 我 们 提供 了 另外 几 个 例子 来 
说 明 这 个 微型 架构 的 优势 。 它 甚至 可 以 运行 带 有 过 程 ， 各 种 循环 结构 和 不 同 的 选项 程序 。 

第 一 个 程序 是 实现 两 个 数 的 相 加 (这 两 个 数字 都 位 于 主 存储 器 中 ) ， 将 结果 存 人 存储 器 中 。 
( 暂 不 考虑 输入 /输出 ) 。 

表 4-3 列 出 了 实现 上 述 功能 的 一 个 汇编 语言 程序 ， 以 及 相应 的 机 咒语 言 程序 。 指 令 栏 中 的 
站 令 构 成 了 实际 的 汇编 语言 程序 。 我 们 知道 ， 程 序 的 运行 是 通过 获取 第 一 条 程序 指令 开始 进入 
取 指 - 译 码 - 执行 周期 的 ， 因 此 ， 当 加 载 程序 开始 执行 时 ， 它 首先 要 将 第 一 条 指令 的 地 址 装 和 人 
到 PC 中 。 为 了 简单 起 见 ， 我 们 假设 在 MARIE 的 程序 中 总 是 从 地 址 100( 十 六 进 制 ) 开始 加 载 。 


表 4-3 ”实现 两 个 数 相 加 的 一 个 程序 








六 进 制 地 址 地 址 内 存 地 址 中 的 二 进 制 内 容 内 存 中 的 十 六 进 制 内 容 
100 Load 104 0001000100000100 1104 
101 Add 105 0011000100000101 3105 


102 Store 106 0010000100000110 2106 











( 续 ) 









”内存 地 址 中 的 二 进 制 内 容 


0111000000000000 7000 
104 0000000000100011 0023 
105 1111111111101001 FFE9 


0000000000000000 


在 内 存 地 址 列 中 的 二 进 制 内 容 下 指令 列表 构成 了 实际 的 机 器 语言 程序 。 十 六 进 制 程序 比 二 
进 制程 序 更 易于 阅读 ， 所 以 存储 器 中 的 实际 内 容 是 以 十 六 进 制 格式 显示 的 。 为 了 避免 使 用 下 标 
16， 我 们 使 用 标准 的 “0x” 符 号 来 表示 十 六 进 制 数 。 例 如 ， 我 们 写 0x123 ， 而 不 是 写 12316。 

该 程序 将 0x0023 (或 十 进 制 值 33 ) 装 人 到 AC 中 。 然 后 加 上 地 址 0x105 上 的 数 0xFFE9 (十进制 
值 为 -23 ) 。 求 和 的 计算 结果 为 0x000C 或 12， 并 且 放 回 到 AC 中 。store 指令 将 这 个 求 和 结果 存 
储 到 地 址 为 0x106 的 存储 单元 中 。 当 程序 运行 完成 后 ， 存 储 地 址 0x106 中 的 二 进 制 内 容 变 为 
0000000000001100， 即 十 六 进 制 000C 或 十 进 制 12。 图 4-14 表示 程序 在 执行 时 各 寄存 器 中 的 内 容 。 


MRIRILID 
[ee mts- | ol | 08 | 1o4| -| 
et operang ee 一 wb | 101 | 1104 | 104 ao 有 -一 -| 


a) Load 104 


tinitial vanuesj | 01 | i104 
105 
105 














i 
| | eeesas Ris-1217| 102| 3105| 105 [0023 | 0023 | 
et operana [wpae—uivaR] | 102| 3105| 105 |EEE 昌 | 0023 | 


b) Add 105 


dinitial values) | | 102 | 3105| 105 | preo | 
102 











03 
0 
3 


和 


c) Store 106 
图 4-14 两 个 数 相 加 的 程序 踪迹 
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图 4-14c 所 示 的 最 后 一 个 RTN 指令 是 将 求 和 结果 放 到 合适 的 存储 单元 中 。“ decode IR[15 -12]” 
语句 表示 必须 对 指令 进行 译 码 ， 才 能 决定 计算 机 所 要 执行 的 操作 。 该 译 码 可 以 在 软件 (使 用 微 
程序 ) 或 硬件 (使 用 硬 连 线 电 路 ) 中 完成 。 这 两 个 概念 在 4. 13 节 中 有 更 详细 的 介绍 。 

请 注意 ， 汇 编 语 言 和 机 器 语言 指令 之 间 存 在 一 对 一 的 关系 。 利 用 这 种 对 应 关系 可 以 很 方便 
地 进行 汇编 语言 和 机 器 代码 之 间 的 转换 。 利 用 本 章 中 给 出 的 指令 列表 ， 读 者 可 以 对 本 章 列 举 的 
各 个 程序 进行 编译 处 理 。 基 于 这 种 理由 ， 我 们 在 以 后 的 介绍 中 只 讨论 汇编 语言 。 但 是 ， 在 介绍 
更 多 编程 示例 之 前 ， 我 们 先 来 讨论 程序 的 编译 过 程 。 


4. 11 关于 编译 程序 的 讨论 


在 表 4-3 所 示 的 程序 中 ， 将 汇编 语言 指令 Load 104 转换 为 机 器 语言 指令 0x1104 是 一 件 很 
简单 的 事情 。 但 是 为 什么 要 这 样 做 呢 ? 为 什么 不 直接 写 机 器 代码 ?虽然 计算 机 将 这 些 指 令 看 作 
二 进 制 数字 是 非常 有 效 的 ， 但 人 类 难以 理解 和 编写 由 0 和 1 组 成 的 序列 。 我 们 更 喜欢 使 用 单词 
和 符号 ， 所 以 要 设计 一 个 程序 来 完成 这 种 简单 的 转换 工作 ,似乎 这 是 一 种 自然 的 解决 方案 。 这 
个 程序 叫 作 编 译 程序 。 


4. 11. 1 编译 程序 的 作用 


编译 程序 的 任务 就 是 将 使 用 助 记 符 的 汇编 语言 转换 为 机 器 语言 ， 这 种 机 器 语言 是 完全 由 二 
进 制 值 0 和 1 组 成 的 字符 串 构 成 的 。 编 译 程序 首先 阅读 程序 员 编 写 的 汇编 语言 程序 ， 这 些 汇编 
语言 程序 实际 上 是 一 些 二 进 制 数 的 符号 表示 形式 ， 然 后 ， 将 其 转换 为 二 进 制 指令 或 等 效 的 机 器 
代码 。 在 这 里 编译 程序 读 取 的 是 源 文件 (汇编 语言 程序 ) 并 生成 一 个 由 机 器 代码 组 成 的 目标 
文件 。 

利用 简单 的 字母 来 蔡 代 操 作 码 会 使 编程 变 得 更 容易 。 我 们 还 可 以 用 标记 符号 ( 简单 的 名 
称 ) 来 标识 或 命名 一 些 特定 的 存储 器 地 址 ， 从 而 使 编写 汇编 程序 的 工作 更 加 简单 。 例 如 ， 在 上 
面 介绍 的 两 个 数字 相 加 的 程序 中 ， 就 可 以 使 用 标记 符号 来 代表 存储 器 地 址 ， 这 样 在 编程 时 我 们 
无 须 直 接 知道 指令 中 各 操作 数 的 具体 的 存储 器 地 址 。 表 4-4 说 明 的 就 是 这 样 一 种 概念 。 























如 果 指 令 的 地 址 字段 放置 的 是 一 个 标记 符 表 4-4 ”使 用 标识 符号 的 例子 
号 ， 而 不 是 真实 的 物理 地 址 ， 编 译 程序 仍然 必须 六 进 制 地 址 指令 
将 其 翻译 成 主 存储 器 中 的 真实 物理 地 址 。 大 多 数 gr a 
汇编 语言 都 允许 使 用 标记 符号 。 通 常 编译 程序 会 101 aaa YY 
规定 各 种 指令 所 遵从 的 格式 ， 其 中 包括 有 关 标 记 02 Store 2 
符号 的 各 种 规定 。 例 如 ， 可 以 规定 标记 符号 应 限 03 Halt 
制 为 3 个 字符 ， 同 样 也 可 以 要 求 标记 符号 出 现在 104 X， 0023 
指令 的 第 一 个 字段 。MARIE 则 要 求 标 记 符 号 后 105 Y， FFE9 
面 必 须要 加 一 个 “,” 的 标点 符号 。 106 2， 0000 








标记 符号 对 编程 人 员 来 说 非常 方便 。 但 是 ， 

对 编译 程序 而 言 ， 标 记 符号 的 翻译 却 需要 花费 更 多 的 步 又 。 对 于 采用 标记 符号 编写 的 汇编 程 
序 ， 编 译 程序 必须 进行 两 次 转换 。 这 就 意味 着 编译 程序 需要 通读 程序 两 次 ， 每 次 阅读 都 是 按 从 
上 至 下 的 顺序 进行 的 。 在 第 一 次 通读 时 ， 编 译 程序 会 建立 一 组 名 为 符号 表 的 对 应 关系 。 例 如 ， 
在 上 面 的 例子 中 ， 编 译 程序 就 建立 了 一 个 包含 3 个 符号 (X、Y 和 2Z) 的 对 应 表 。 因 为 当 编译 程 
序 从 上 至 下 阅读 程序 代码 时 ， 它 不 可 能 一 次 就 将 全 部 的 汇编 语言 指令 转换 成 机 器 代码 。 原 因 是 
对 于 只 使 用 标记 符号 的 指令 ， 编 译 程序 还 不 知道 指令 的 数据 部 分 存放 在 存储 器 中 的 具体 位 置 。 
但 是 ,在 符号 表 建立 之 后 ， 编 译 程序 可 以 进行 第 二 次 通读 ， 并 且 会 “填充 原来 的 空白 位 置 ”。 


160 第 4 章 








在 上 述 例子 中 ， 编 译 程序 的 第 一 次 通读 生成 一 个 符号 表 ， 如 下 所 示 : 


> 0x104 
0x105 















0x106 


同时 ， 编 译 程序 也 开始 翻译 程序 指令 。 在 进行 第 一 次 通读 后 ， 翻 译 出 来 的 指令 并 不 完整 ， 
如 下 表 所 示 : 








|PPlom| 一 
EOINI<|IxXx 





0 0 


在 第 二 次 通读 时 ， 编译 程序 使 用 符号 表 来 填充 空白 地 址 ， 并 且 生 成 相应 的 机 器 语言 指令 。 
这 样 ， 在 第 二 次 通读 时 ， 编 译 程序 就 知道 了 X 是 地 址 0x104 的 存储 单元 ， 并 且 会 使 用 0x104 来 
替代 标记 符号 X。 同 样 ， 也 使 用 类 似 的 过 程 来 替代 Y 和 Z， 结 果 如 下 : 











S| 
Ol 


1 
| 
1 
0 


说 Dllw | 一 


因为 大 多 数 人 都 不 喜欢 读 十 六 进 制 数 ， 所 以 大 多 数 汇编 语言 允许 指定 存储 在 存储 器 中 的 数 
据 值 是 二 进 制 数 、 十 六 进 制 数 或 十 进 制 数 。 通 常 ， 编 译 程序 会 使 用 某 种 类 型 的 汇编 指令 提供 给 
编译 程序 ， 以 专门 解释 这 些 数值 所 采用 的 基数 ，( 是 一 种 专门 为 编译 程序 设计 的 指令 ， 它 本 身 
不 会 翻译 成 机 器 代码 ) 。 在 MARIE 汇编 语言 中 我 们 用 DEC 表示 十 进 制 数 ，HEX 表示 十 六 进 制 
数 。 例 如 ， 我 们 可 以 使 用 这 些 汇编 指令 重新 编写 表 4-4 所 示 的 程序 ， 如 表 4-5 所 示 。 























如 果 并 不 希望 阅读 实际 的 二 进 制 数据 值 ( 书 表 4-5 使 用 汇编 指令 的 常数 表示 法 
写 形式 为 十 六 进 制 数 ) ， 可 以 使 用 汇编 指令 DEC 于 一 
来 指定 十 进 制 数值 。 编 译 程序 能 够 识别 该 汇编 指 有 a 
令 ， 并 且 会 在 数据 存放 到 存储 器 之 前 转换 成 相应 101 | a 
的 二 进 制 数 值 。 另 外 ， 该 汇编 指令 不 会 转换 成 机 102 和 
器 语言 ， 只 是 指示 编译 程序 以 某 种 方式 来 工作 。 103 Halt 
另外 注释 分 隔 符 是 一 种 几乎 对 每 一 种 编程 话 bo DEC 35 
言 都 通用 的 汇编 指令 。 它 是 一 些 特殊 的 字符 ， 用 105 Y， DEC -23 
来 告诉 编译 程序 (或 编译 器 ) 在 进行 编译 转换 时 ， 106 2z， HEX 0000 





忽略 跟随 在 这 个 特殊 符号 后 面 的 所 有 文本 内 容 。 
MARIE 的 注释 分 隔 符 是 一 个 前 斜 枉 “/” 符 号， 其 作用 是 忽略 位 于 这 个 分 隔 符 和 该 行 行 末 之 间 
的 所 有 文本 内 容 。 


4. 11.2 使 用 汇编 语言 的 原因 


介绍 MARIE 汇编 语言 的 主要 目的 是 为 了 使 读者 了 解 这 种 语言 和 计算 机 体系 结构 之 间 的 相 
互 关系 。 了 解 怎样 利用 汇编 语言 编程 有 助 于 很 好 地 理解 计算 机 的 体系 结构 ， 反 之 亦 然 。 学 习 汇 
编 语 言 不 但 可 以 了 解 计算 机 的 基本 体系 结构 ， 而 且 可 以 真正 认识 处 理 器 的 工作 原理 并 深刻 理解 
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所 编程 的 特定 计算 机 系统 的 具体 内 部 构造 。 学 习 汇 编 语言 编程 还 会 有 其 他 的 一 些 益 处 。 

大 多 数 的 程序 员 都 通常 认为 在 一 个 程序 中 10% 的 代码 可 能 会 占用 90% 的 CPU 时 间 。 对 于 
一 些 时 间 因 素 非常 关键 的 应 用 ， 常 常 需要 对 这 10% 的 代码 进行 优化 处 理 。 一 般 情况 下 ， 编 译 
器 可 以 处 理 这 种 优化 过 程 。 它 首先 处 理 高 级 语言 (如 C ++ ) ， 将 其 转换 成 汇编 语言 ， 然 后 再 转 
换 成 机 器 代码 。 编 译 器 的 应 用 已 经 有 相当 长 的 一 段 时 间 ， 而 且 在 大 多 数 情况 下 它 能 够 高 效 工 
作 。 但 是 ， 在 某 些 情况 下 ， 程 序 员 需 要 避 开 高 级 语言 的 某 些 限制 ， 而 直接 使 用 汇编 代码 。 通 过 
这 种 方法 ， 程 序 员 可 以 使 程序 在 时 间 和 空间 上 都 具有 更 高 的 效率 。 通 常 ， 利 用 混合 编程 的 方法 
( 即 一 个 程序 的 大 部 分 内 容 使 用 高 级 语言 ， 但 某 些 部 分 直接 使 用 汇编 语言 ) 可 以 让 程序 员 充 分 
发 挥 这 两 种 语言 的 各 自 优势 。 

现在 的 问题 是 ， 在 何 种 情况 下 程序 应 该 采用 汇编 语言 来 编写 ?如 果 一 个 程序 的 大 小 或 响应 
时 间 是 程序 设计 考虑 的 关键 因素 ， 那 么 汇编 语言 通常 是 首选 。 这 是 因为 编译 器 会 屏蔽 掉 各 种 操 
作 的 耗 时 信息 。 这 样 ， 程 序 员 常常 很 难 判断 由 编译 器 编译 的 程序 的 实际 运行 过 程 。 而 汇编 语言 
可 以 让 程序 员 更 贴近 机 器 的 体系 结构 ， 并 且 更 准确 地 控制 程序 的 执行 。 如 果 程 序 员 需 要 实现 某 
些 高 级 语言 所 不 具备 的 操作 ， 那 么 使 用 汇编 语言 是 必 不 可 少 的 。 

如 果 响 应 特性 和 空间 ( 即 程序 大 小 ) 是 程序 设计 的 关键 因素 ， 则 可 以 在 艇 入 式 系统 中 找到 
一 个 理想 的 例子 。 在 实际 应 用 的 能 人 式 系统 中 ， 计 算 机 通常 被 集成 为 某 个 系统 的 一 个 部 件 ， 而 
不 是 纯粹 的 计算 机 。 艇 人 式 系统 的 应 用 非常 广泛 ,经常 在 时 间 约 束 的 环境 下 使 用 。 这 些 艇 人 式 
系统 常常 被 设计 为 只 能 执行 一 个 单一 指令 或 是 专用 的 指令 集 。 也 许 我 们 每 天 都 在 使 用 某 种 类 型 
的 储 入 式 系统 。 例 如 ， 消 费 者 使 用 的 电子 产品 (如 照相 机 、 摄 录 机 、 移 动 电 话 、PDA 和 交互 式 
游戏 设备 等 ) ， 家 用 电器 (如 洗 碗 机 、 微 波 炉 和 洗衣 机 等 )， 汽 车 (特别 是 其 中 的 发 动机 控制 和 
防 抱 死 刹车 系统 ) ， 医 疗 仪器 (如 CAT 扫描 仪 和 心脏 监视 器 ) ， 以 及 工业 设备 (如 生产 过 程 的 控 
制 设 备 和 航空 设备 ) 等， 这 些 都 只 是 苦 入 式 系统 应 用 的 一 小 部 分 例子 。 

对 于 一 个 戏 人 式 系统 而 言 ， 软 件 是 非常 关键 的 。 典 人 式 软件 需要 在 某 些 非常 特殊 的 响应 参 
数 之 中 执行 ， 并 且 它 能 占用 的 空间 是 非常 有 限 的 。 这 些 是 汇编 编程 语言 的 完美 应 用 。 我 们 会 在 
第 10 章 深 入 人 研究 它 。 


4. 12 ”指令 集 的 扩展 
尽管 使 用 MARIE 的 指令 集 足 以 编写 任何 所 需 的 程序 ， 但 我 们 可 以 再 增加 几 条 指令 使 MA- 
RIE 的 编程 任务 变 得 更 加 简单 。MARIE 的 操作 码 是 4 位 二 进 制 数 ， 这 意味 着 一 共 可 以 生成 16 
条 不 同 的 指令 ， 而 我 们 只 使 用 了 其 中 的 9 条。 我 们 可 以 通过 在 指令 集中 添加 一 些 精心 挑选 的 指 
令 ， 使 许多 编程 任务 更 容易 。 表 4-6 中 列 出 了 新 扩充 的 指令 。 
表 4-6 ”MARIE 的 扩充 指令 集 
本 ”含义 

















将 PC 内 容 存储 到 地 址 Xx 处 ， 然 后 跳 转 到 地 址 X+1 
A Clear AC 中 的 所 有 位 清 0 
间接 相 加 : 进入 地 址 X， 使 用 单元 中 的 数值 作为 数据 操作 的 实际 地 址 ， 取 出 操作 数 
































B RAddI X 加 到 累加 器 AC 中 
间接 转移 ;进入 地 址 x， 使 用 X 单元 中 的 数值 作为 存储 单元 的 实际 地 址 ， 然 后 跳 转 至 
GS JumpI 又 = 
该 存储 单元 
D LoadI X 间接 加 载 ; 转 到 地 址 x， 使 用 xX 单元 的 值 作为 操作 数 的 实际 地 址 ， 加 载 到 AC 中 
E StoreIl x 间接 存储 : 转 到 地 址 xXx， 使 用 X 单元 的 值 作 为 累加 器 中 存储 值 的 目标 地 址 





Jns( 跳 转 和 存储 ) 指 令 可 以 对 某 个 返回 指令 存储 地 址 指针 ， 然 后 继续 对 不 同 的 指令 设置 
PC 值 。 利 用 这 条 指令 可 以 进行 过 程 调 用 和 其 他 子 程序 的 调用 ， 而 当 子 程序 执行 完成 后 系统 又 
会 返回 到 原 程序 代码 中 的 调用 点 。Cleazr 指令 会 将 累加 器 中 的 二 进 制 位 全 部 设置 为 0。 利 用 这 
条 指令 可 以 缩短 机 器 周期 ， 否 则 完成 相同 的 清 零 操作 需要 从 内 存 中 装 入 0 操作 数 ， 这 会 花费 更 
多 的 时 间 。 

使 用 AddI、JumpI、LoadI 和 StoreI 指令 , 我 们 引入 了 不 同 的 寻 址 模式 。 前 面 介绍 的 
所 有 指令 都 假设 指令 数据 部 分 的 值 是 指令 所 需 操作 数 的 直接 地 址 。 这 些 指 令 使 用 间接 寻 址 模 
式 。 而 不 是 使 用 位 置 X 找到 的 值 作为 实际 地 址 ， 我 们 使 用 X 中 找到 的 值 作为 指向 新 内 存 位 置 
的 指针 ， 它 包含 要 在 指令 中 使 用 的 数据 。 例 如 ， 要 执行 aadI 400 指令 ,我 们 首先 进入 位 置 
0x400。 如 果 我 们 找到 存储 在 0x400 位 置 的 值 是 0x240， 则 将 转 到 位 置 0x240 来 获取 指令 的 实际 
操作 数 。 我 们 基本 上 人 允许 使 用 指针 ， 这 给 我 们 创造 高 级 数据 结构 和 操作 字符 串 提供 了 巨大 力 
量 。( 我 们 第 5 章 深 入 研究 寻 址 模式 。) 

以 下 采用 寄存 器 传输 表示 法 说 明了 6 条 新 的 指令 : 


JnS Jumpl X 
MBR ¢- PC MAR 人- X 
MAR ¢- X MBR ¢- MI[MAR] 
MI[MAR] < MBR PC 人 MBR 
MBR ¢- X 

LoadlX 
AG 1 

MBR < X 
AC ¢ AC + MBR 

MBR 全- MI[MAR] 
PC ¢- AC 

MAR <- MBR 
Clear MBR < MI[MAR] 
AC¢-0 AC < MBR 
AddlX Storel X 
MAR 人 X MBR ¢- X 
MBR 人 MI[MAR] MBR ¢- MI[MAR] 
MAR ¢- MBR MAR ¢- MBR 
MBR ¢— MI[MAR] MBR < AC 
AC ¢ AC + MBR MI[MAR] ¢- MBR 


表 4-7 为 MARIE 整个 指令 集 的 总 结 。 


表 4-7 MARIE 的 完整 指令 集 
RIN 








MBR*«—PC 
MAR<—X 
M[ MAR ] —MBR 
MBR<e—X 
ACe—1 
ACe—AC + MBR 
PCe—AC 


0000 





MAR*—X 
MBR*—M[ MAR | 
AC*—MBR 


0001 





MAR¢-X, MBR*—AC 


0010 
M[ MAR | —MBR 


Store X 
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( 续 ) 





MAR<*—X 
0011 Add X MBR*—M[ MAR ] 
AC*—AC + MBR 





MAR<—X 
0100 Subt X MBR*—M[ MAR |] 
AC*—AC-MBR 





0101 Input AC*—InNREG 





0110 Output OutREG* 一 AC 








gli11 | Halt 


If IR[11-10] =00 then 
IE AC <0 then PC PC+1 
Skip- Else If IR[11-10] =01 then 
cond If AC=0 then PC PC+1 
Else If IR[11-10] =10 then 
If AC >0 then PC PC +1 


1000 





1001 Jump X PC*—IR[11-0] 











1010 Clear AC—0 





MAR*—X 

MBR<*—M[ MAR ] 
1011 AdaI X MRAR< -MBR 
MBRt-M[ MAR ] 
RACt 二 AC + MBR 








OG 
MAR*—X 

1100 JumpI X MBR*—M[ MAR ] 
PCt MBR 











MRAR<-X 
MBR*—M[ MAR ] 
1101 LoadI X MAR*—MBR 

MBR*—M[ MAR ] 


AC*—MBR 


MAR+ 一 X 








MBR*—M[ MAR ] 
了 StoreI X MAR<*—MBR 
MBR*—AC 

M[ MAR ] *—MBR 








我 们 来 看 一 些 使 用 完整 指令 集 的 例子 。 
以 下 是 使 用 循环 来 添加 5 个 数字 的 示例 : 


Hex 

Address Instruction 

100 Load Addr /Load address of first number to be added 
i01 Store Next /Store this address as our Next pointer 

102 Load Num /Load the number of items to be added 

103 Subt One /Decrement 

104 Store Ctr /Store this value in Ctr to control looping 


105 Loop, Load Sum /Load the Sum into AC 


下 
小 
起 
地 





106 RddI Next /Add the value pointed to by location Next 

107 Store Sum /Store this sum 

108 Load Next /Load Next 

109 Add One /Increment by one to point to next address 

10A Store Next /Store in our pointer Next 

10B Load Ctr /Load the loop control variable 

10C Subt One /Subtract one from the loop control variable 

10D Store CEr /Store this new value in loop control variable 

10E Skipcond 000 /If control variable < 0, skip next 
/instruction 

10F Jump Loop /Otherwise, go to Loop 

110 Halt /Terminate program 

1 Addr, Hex 17 /Numbers to be summed start at location 117 

2 Next, Hex 0 /A pointer to the next number to add 

和 3 Num, Dec 各 /The number of values to add 

114 Sum, Dec 0 /The sum 

115 Cr; Hex 0 /The loop control variable 

116 One, Dec 第 /Used to increment and decrement by 1 

sl ly Dec 10 /The values to be added together 

TL8 Dec 15 

L159 Dec 20 

11A Dec 25 

11B Dec 30 

注意 : 程序 中 的 行 号 仅 供 参考 ， 不 能 在 MarieSim 环 境 中 使 用 。 a 


程序 中 使 用 注释 来 对 各 条 程序 语句 进行 了 合理 的 解释 。 现 在 ,我 们 还 要 针对 例 4. 2 进行 一 
些 讨论 。 读 者 可 以 回顾 一 下 符号 表 存储 [标号 ， 存储 单 元] 对 的 情形 。 指 令 Load Addr 现在 变 
成 了 Load 111， 因 为 Addr 指定 为 物理 存储 器 中 的 地 址 0x111。 然 后 将 存放 在 Addr 中 的 数值 
0x117 存放 到 Next 处 。Next 是 一 个 地 址 指针 ， 人 允许 把 要 进行 相 加 的 5 个 数值 (分 别 位 于 十 六 
进 制 地 址 117、118、119、11A 和 11B 的 单元 内 )“ 逐 次 装 入 ”。 变 量 ctr 跟踪 记录 程序 所 执行 
的 循环 迭代 次 数 。cCtr sum( 初始 值 为 0) 载 人 AC 中 ,每 次 循环 都 从 Ctr sum 减 去 1 开始 ， 然 
后 检查 ctr 是 否 为 负 值 ， 如 果 为 负 值 ， 则 终止 循环 。 循 环 开始 后 ， 使 用 Next 作为 要 加 到 AC 
中 各 个 数据 的 地 址 。 当 ctr 为 负 值 时 ，skipcond 语句 就 会 终止 循环 ， 跳 过 接 下 来 的 一 条 无 条 
件 跳 转 指 令 到 循环 体 的 顶部 。CPU 执行 到 Halt 指令 时 ， 整 个 程序 的 运行 就 终止 了 。 

例 4.3 显示 了 如 何 使 用 Skipcond 和 Jump 指令 实现 不 同 的 选择 。 虽 然 本 程序 展示 的 是 一 
个 if/else 结构 ， 但 我 们 也 可 以 很 容易 地 修改 它 ， 来 实现 一 个 if/then 结构 ， 或 者 case 
(或 switch) 结 构 。 

本 例 说 明了 如 何 使 用 if/else 结构 来 实现 多 种 选择 。 具 体 说 ， 程 序 执行 了 如 下 
的 操作 : 


i hern 


并 二 
else 

bt a 
Hex 
Address Instruction 
100 TE Load xX /Load the first value 
LO Subt 于 /Subtract the value of Y, store result in AC 
102 Skipcond 400 /If AC = 0, skip the next instruction 
103 Jump Else /Jump to Else part if AC is not equal to 0 
104 Then, Load xX /Reload X so it can be doubled 
105 Add 区 /Double X 
106 Store X /Store the new value 
107 Jump Endif /Skip over the false, or else, part to end of 


#4E 
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108 Else, Load 芝 /Start the else part by loading Y 

109 Subt 区 /Subtract X from Y 

10A Store 癸 /Store Y ~- XX iniY 

10B Endif, Halt /Terminate program (it doesn’t do much!) 

Loe X, Dec 3 /Load the loop control variable 

10D bE Dec 20 /Subtract one from the loop control variable 机 


该 程序 演示 了 使 用 间接 寻 址 来 遍历 和 输出 字符 串 ， 此 字符 串 以 null 结尾 。 


Hex 

Address Instruction 

100 Getch, LoadI Chptre /Load the character found at address Chptr. 
101 Skipcond 400 /IE AC = 0, skip next instruction. 
102 Jump Outp /Otherwise, proceed with operation. 
103 Halt 

104 Outp, Output /Output the character. 

05 Load Chptr /Move pointer to next character. 
106 Add One 

T1087 Store Chptr 

108 Jump Getch /Process next character. 

109 One, Hex 0001 

10RA Chptr; Hex 10B /Pointer to “current’” character. 
10B String, Dec 072 瑟 /String definition starts here. 

10C Dec 101 /e 

10D Dec i108 “对 

10E Dec i108 /1 

10F Dec T1114 /Go 

i120 Dec 032 /[space] 

11 Dec 119 /w 

112 Dec El /6 

入 Dec 114 /rr 

114 Dec 108 /1 

115 Dec 100 /a 

i116 Dec 033 A1 

A Dec 000 [nulll] 

END a 


例 4.4 演示 了 如 何 使 用 LoadI 和 storel 指令 打印 字符 串 。 了 解 C 和 C ++ 编程 语言 的 读 
者 将 会 了 解 这 样 的 方式 : 我 们 首先 声明 字符 串 中 第 一 个 字符 的 内 存 位 置 并 依次 读 取 它 ， 直 到 找 
到 一 个 null 字符 。 一 旦 LoadI 指令 在 累加 器 中 放置 一 个 空 值 ，Skipcond 400 的 计算 结果 会 
为 true， 并 且 执 行 Halt 指令 。 我 们 注意 到 ， 要 想 处 理 字 符 串 的 每 个 字符 ， 需 要 增加 “当前 字 
符 ” 指 针 Chptr， 以 便 它 指向 要 打印 的 下 一 个 字符 。 

例 4.5 演示 了 如 何 JNS 和 JumpI 调用 子 程序 。 该 程序 包括 一 个 END 语句 ， 它 是 编译 器 指 
令 的 另 一 个 例子 。 该 语句 告诉 汇编 程序 程序 结束 的 地 方 。 其 他 没有 指明 的 指令 包括 让 汇编 程序 
知道 在 哪里 可 以 找到 第 一 个 程序 的 指令 ， 如 何 设置 内 存 的 指令 以 及 代码 块 是 否 为 程序 的 语句 。 

本 例 说 明了 使 用 简单 的 子 程序 使 存储 在 X 上 的 值 加 倍 。 


Hex 

Address Instruction 

100 Load XxX /Load the first number to be doubled 

0 Store Temp /Use Temp as a parameter to pass value to Subr 
102 Jns Subr /Store return address, jump to procedure 

103 Store XxX /Store first number, doubled 

104 Load w /Load the second number to be doubled 

05 Store Temp /Use Temp as a parameter to pass value to Subr 


106 JnS Subr /Store return address, jump to procedure 
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107 Store 迹 /Store second number, doubled 
108 Halt /End program 
109 7 Dec 20 
10RA Dec 48 
10B Temp, Dec 0 
0 Subr, Hex 0 /Store return address here 
10D Load Temp /Subroutine to double numbers 
10E Add Temp 
10F JumpI Subr 
END 
注意 : 程序 中 的 行 号 仅 供 参考 ， 不 能 在 MarieSim 环 境 中 使 用 。 a 


使 用 MARIE 的 简单 指令 集 ， 应 该 能 够 实现 任何 高 级 编程 语言 的 结构 ， 如 循环 语句 和 while 
语句 。 这 些 在 本 章 末 尾 作为 练习 。 


4. 13 ”关于 译 码 的 讨论 : 硬 连 线 和 微 程序 控制 

控制 单元 实际 上 是 如 何 工作 的 呢 ? 前 面 我 们 已 经 实施 了 一 些 人 为 控制 过 程 ， 并 且 简 单 地 假设 
每 个 事件 都 会 按照 我 们 所 描述 的 方式 进行 。 这 种 做 法 的 基本 理解 是 ， 对 于 每 条 指令 ， 控 制 单元 都 
能 够 控制 CPU 按 正确 的 步骤 执行 操作 。 事 实 上 ,在 CPU 中 必须 有 一 些 控制 信号 连 线 到 各 个 数字 
部 件 ， 这 样 才能 使 CPU 可 以 按照 上 述 方式 正确 工作 (读者 可 以 回顾 第 3 章 描述 的 各 个 数字 部 件 ) 。 
例如 ， 在 MARIE 使 用 汇编 语言 执行 adaa 指令 时 ， 实 际 上 我 们 就 已 经 假设 了 加 法 运算 可 以 发 生 。 
因为 控制 信号 将 ALU 设置 为 加 法 运算 ， 并 将 结果 存放 到 AC 中 。ALU 具有 不 同 的 控制 线 ， 它 们 可 
以 决定 执行 哪 一 种 操作 。 现 在 要 解决 的 问题 是 ， 这 些 控制 线 实 际 上 是 如 何 被 选中 的 。 

控制 单元 由 处 理 器 的 时 钟 驱 动 ， 负 责 译 码 指令 寄存 器 中 的 二 进 制 值 并 创建 所 有 必要 的 控制 
信号 。 基 本 上 ， 控 制 单元 使 CPU 为 每 个 程序 指令 执行 一 系列 的 “控制 ” 步 又。 每 个 控制 步骤 
都 会 使 控制 单元 创建 一 组 执行 适当 微 操作 的 信号 ( 称 为 控制 字 ) 。 

可 以 采用 两 种 方法 来 正确 设置 各 条 控制 线 。 第 一 种 方法 是 硬 连 线 控制 ， 它 从 物理 上 将 各 条 
控制 线 与 实际 的 机 器 指令 连接 起 来 。 一 般 来 说 ， 指 令 被 划分 成 不 同 的 字段 。 字 段 中 不 同 的 位 连 
接 到 输入 线 上 ， 用 来 驱动 不 同 的 数字 逻辑 部 件 。 第 二 种 方法 是 微 程序 控制 ， 使 用 由 微 指令 组 成 
的 软件 ， 它 们 执行 指令 的 微 操 作 。 在 我 们 描述 完 一 般 的 机 器 控制 之 后 ， 我 们 会 更 详细 地 看 这 两 
种 控制 方法 。 


4. 13.1 机 器 控制 


在 4.8 节 和 4.12 节 中 ， 我们 为 MARIE 指令 提供 了 寄存 器 转换 语言 。 由 寄存 器 转换 语言 
述 的 微 操作 实际 上 定义 了 控制 单元 的 操作 。 每 个 微 操作 都 与 独特 的 信号 模式 相关 联 。 信 号 送 到 
控制 单元 的 组 合 电路 内 ， 其 执行 适合 该 指令 的 逻辑 运算 。 

图 4-9 显示 了 MARIE 的 数据 通路 。 我 们 看 到 每 个 寄存 器 和 主 存储 器 沿 着 数据 通路 都 有 一 
个 地 址 (0 ~7) 。 这 些 地址 是 以 数字 信和 号 的 形式 表示 的 ， 控 制 单元 使 用 这 些 地 址 来 控制 字 节 流 
在 系统 中 的 流动 。 为 了 举例 说 明 ， 我 们 定义 了 两 组 信号 : P 、P, 、Pu, ， 它 们 从 存储 器 或 寄存 器 
读 取 数 据 ， 对 寄存 器 或 存储 器 进行 写 人 使 用 信号 P; 、P, 、P;。 传 送 这 些 信号 的 控制 线 通 过 组 合 
逻辑 电路 连接 到 寄存 器 。 

关于 MARIE 的 MBR( 地 址 3 ) 与 数据 通路 的 连接 特写 图 如 图 4-15 所 示 。 因 为 每 个 寄存 器 都 
以 类 似 的 方式 连接 到 数据 通路 ， 所 以 我 们 必须 确保 它们 不 竞争 总 线 。 这 是 通过 引入 三 态 装置 来 
完成 的 。 该 电路 具有 3 个 输入 ， 使 用 一 个 输入 来 充当 电路 的 开关 。 如 果 输 入 为 1， 则 装置 关闭 ， 
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值 可 以 “ 流 过 ” 。 如 果 输 入 为 0， 则 装置 打开 ,不 允许 任何 值 流 过 。 用 于 控制 这 些 设备 的 输入 
来 自 以 P,、P, 和 P, 为 输入 的 译 码 器 的 与 门 。 


D's Di Do Di Di 





控制 单元 


图 4-15 将 MARIE 的 MBR 连接 到 数据 通路 


在 图 4-15 中 ， 我 们 看 到 如 果 P, 和 P, 为 高 电 平 ， 则 该 与 门 计 算 PP,Pu， 当 选择 MBR 读 取 
数据 时 (这 意味 着 MBR 正在 写 和 总线, 或 D。 ~ D, ) 输 出 为 1。 其 他 寄存 器 都 与 总 线 断 开 ， 因 为 
它们 的 三 态 设备 从 该 译 码 器 与 门 接收 到 了 0 值 。 我 们 还 可 以 在 图 4-15 中 看 到 如 何 将 值 写 入 
MBR( 从 总 线 上 读 取 ) 。 当 P, 和 P 为 高 电 平 时 ，P; 、P, 和 Ps 的 译 码 咒 与 门 输出 为 1， 这 导致 D 
触发 器 开始 计时 ， 并 将 来 自 总 线 的 值 存 储 在 MBR 中 。( 数 据 通路 上 其 他 实体 的 组 合 逻 辑 可 以 作 
为 一 个 练习 。) 

如 果 我 们 学 习 MARIE 的 指令 集 ， 将 看 到 ALU 只 有 3 个 操作 : 加 、 减 和 清 零 。 我 们 还 需要 











计算 机 的 时 钟 通过 在 恰当 的 时 间 生 产 恰 当 的 
信号 来 执行 微 操作 。 在 MARIE 中 不 同 指令 需要 1L 1 | Acrocem _ 
的 时 钟 周期 是 不 同 的 。 来 自 周期 计数 器 的 信号 协调 在 每 个 时 钟 周期 内 发 生 的 活动 。 一 种 方法 是 
将 时 钟 连接 到 同步 计数 器 ， 并 将 计数 器 连接 到 译 码 器 。 假 设 指令 所 需 的 时 钟 周期 数 最 多 为 8， 
那么 我 们 需要 一 个 3 位 计数 器 和 一 个 3-8 译 码 器 。 译 码 咒 的 输出 信号 T。~TT; 与 组 合 部 件 和 寄存 
器 进行 “与 ”运算 以 产生 指令 所 需要 的 行为 。 如 果 指 令 需要 的 时 钟 周期 少 于 8 个 ， 则 循环 计数 
器 的 信号 C, 置 位 ， 准 备 下 一 个 机 器 指令 。 

我 们 需要 先 讨论 两 个 附加 概念 ， 从 RTN 指令 开始 : PC*-PC +1。 我们 已 经 在 Skipcond 





“无 ”作为 第 四 个 ALU 状态 。 因 此 ，4 个 操作 可 ALU 控制 信号 
以 用 两 个 控制 信号 来 控制 MARIE 的 ALU， 我 们 A A gn 
称 为 A。 和 A, 。 这 些 控制 信号 和 对 应 的 ALU 响应 0 0 无 
已 经 在 表 4-8 中 给 出 。 0 1 | ACAC+MBR 
1 0 | Ac-AC-MBR 
1 
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指令 以 及 取 指 - 译 码 -执行 周期 的 取 指 部 分 看 到 了 这 一 点 。 这 是 一 个 比 看 起 来 更 复杂 的 指令 ， 
常数 1 必须 存储 在 某 个 位 置 ， 这 个 常数 和 PC 中 的 内 容 必 须 输 入 到 ALU 中 ， 所 得 到 的 值 必须 写 
回 到 PC 中 。 因 为 PC 在 本 书 中 本 质 上 是 一 个 计数 器 ， 所 以 我 们 可 以 使 用 类 似 于 图 3-31 所 示 的 
计数 器 电路 实现 PC。 但是， 我 们 不 能 使 用 图 所 示 的 简单 计数 器 ， 因 为 我 们 还 必须 能 够 直接 给 
PC 赋值 (如 执行 JUMP 语句 时 ) 。 因 此 ， 我 们 需要 一 个 带 有 额外 输入 线 的 计数 器 ， 这 样 可 以 使 
用 新 的 输入 行 覆盖 任何 当前 值 。 为 了 使 PC 累计 加 1， 我 们 为 这 个 新 电路 引入 了 一 个 新 的 控制 
信号 IncrPC; 当 该 信号 有 效 并 且 时 钟 沿 到 来 时 ，PC 增加 1。 

我 们 需要 解决 的 第 二 个 问题 是 如 果 更 详细 地 检查 图 4-9， 则 MARIE 数据 通路 就 会 变 得 很 清 
楚 。 请 注意 ，AC 不 仅 可 以 从 总 线 上 读 取 值 ， 还 可 以 从 ALU 中 接收 值 。MBR 有 一 个 类 似 的 替代 源 ， 
因为 它 可 以 从 总 线 读 取 或 直接 从 AC 上 获取 值 。 可 以 使 用 控制 线 Lu 将 多 路 复 用 器 添加 到 图 4-15 中 ， 
以 选择 每 个 寄存 器 应 加 载 的 值 : 默认 可 以 是 总 线 值 (Lur =0) 也 可 是 替代 源 (Lur =1)。 

为 了 将 所 有 这 一 切 综合 到 一 起 ， 请 考虑 MARIE 的 aaa 指令 。RTN 是 : 

MAR 《一 

MBR ¢- MI[MAR] 

AC 全 AC + MBR 

在 读 取 Add 指令 后 ，X 位 于 IR 最 右边 的 12 位 ，IR 的 数据 通路 地 址 为 7， 所 以 我 们 需要 给 
数据 通路 的 三 个 读 取信 号 P,P,P, 园 高 电 平 ， 以 将 IR 的 0~11 位 放 到 总 线 上 。 地 址 为 1 的 MAR 
通过 将 P, 置 1 来 启动 写 操作 。 在 下 一 个 语句 中 ， 我们 必须 进入 存储 器 并 检索 存储 在 MAR 地 址 
上 的 数据 并 写 人 MBR。 虽 然 这 看 起 来 必须 首先 读 取 MAR 以 得 到 这 个 值 ， 但 在 MARIE 中 ， 我们 
假设 MAR 是 直接 连接 到 内 存 的 。 因 为 我 们 在 图 3-32 所 示 的 内 存 中 只 有 Le le ! 
一 个 写 入 使 能 线 (我 们 将 这 条 控制 线 表 示 为 Mv ) ， 默 认 情 况 下 可 以 读 取 | 
存储 器 ， 而 无 须 设置 任何 其 他 控制 线 。 现 在 让 我 们 修改 该 存储 器 以 包括 A 
读 使 能 线 ( M; ) 。 这 人 允许 MARIE 处 理由 存储 器 引入 数据 总 线 而 引起 的 任 。”  T 
何 竞 争 ， 这 类 似 于 我 们 添加 三 态 设备 到 图 4-15 中 的 原因 。 要 想 获取 从 
内 存 中 读 取 的 值 ， 我 们 使 P 和 P, 有 效 以 写 和 MBR。 最 后 ,我 们 将 
MBR 中 的 值 传递 给 AC， 并 将 结果 写 人 AC。 因 为 MBR 和 AC 直接 连接 到 。 P 
ALU， 所 以 唯一 的 控制 是 : (1) 置 位 A, 以 执行 加 法 。(2) 置 位 P, 以 允许 
AC 改变 。(3) 置 位 Lur 以 强制 AC 从 ALU 中 而 不 是 总 线 上 读 取 值 。 使 用 卫 
我 们 刚刚 定义 的 信和 号， 我们 可 以 将 信号 模式 添加 到 RTN 中 ， 如 下 所 示 : P， 


证 





1 
PPaP1PIT5 : MAR ¢- X p BE 
1 | 
PaP3TaMe: MBR ¢- M[MAR] A 
| 1 
CL.AoPsTsLarr: AC 二 ARC + MBR [reset the clock cycle counter] Pp, 1 


请 注意 ,我 们 是 在 T 周期 开始 的 ， 因 为 取 值 使 用 了 T。、T, 和 T，。 pp 
(将 PC 的 值 复制 到 MAR， 将 指定 的 内 存 值 复制 到 IR， 并 使 PC 增加 1) 。 
上 面 列 出 的 第 一 行 实际 上 是 “获取 操作 数 ” 操 作 ( 因为 它 将 IR[12-0] 中 
的 值 复制 到 MAR) 。 最 后 一 行 包含 控制 信号 C,， 它 可 以 复位 时 钟 周期 计 。 5 
数 器 。 

除了 数据 信号 (D,……D, ) 以 外 的 所 有 信号 都 假定 为 低 ， 除 非 已 在 
RTN 中 指定 。 图 4-16 所 示 为 刚刚 描述 的 信号 模式 序列 的 时 序 图 。 可 以 Lu 
看 出 ， 在 时 钟 周期 C, 内 ， 除 P, 、P, 、P, 、P, 和 T 之 外 的 所 有 信号 都 为 
低 电 平 。 使 能 P,、P, 和 P, 以 允许 读 取 阴 ， 并 且 置 位 P, 以 允许 写 信 ne 
MAR。 只 有 当 T, 被 置 位 时 ， 才 会 发 生 此 操作 。 在 时 钟 周期 C, 内 ， 除 你 时 部 国 | 


. 


: 


图 4-16 MARIE 加 法 
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P;、P,、M; 和 TT 之 外 的 所 有 信和 号 都 为 低 电 平 。 在 时 间 了 T 产生 的 机 器 状态 将 从 主 存储 器 中 读 取 
的 字 节 (地 址 为 零 ) 输 入 到 MBR 上 。Aaa 序列 的 最 后 一 个 微 指令 发 生 在 时 钟 周期 T.， 和 放 和 人 
AC( 因此 Ls 为 高 ) 并 且 时 钟 周期 计数 器 被 复位 。 


4. 13. 2 硬 连 线 控制 


硬 连 线 控制 使 用 指令 寄存 器 中 的 位 ， 并 通过 将 这 些 位 输入 至 基本 逮 辑 门 来 产生 控制 信号 。 
所 有 硬 连 线 件 控制 单元 都 有 3 个 基本 组 件 : 指令 译 码 器 、 循 环 计数 器 和 控制 矩阵 。 根 据 系 统 的 
复杂 性 ， 也 可 以 提供 专门 的 寄存 器 和 状态 标志 集 。 图 4-17 说 明了 一 个 简化 的 控制 单元 。 下 面 


让 我 们 详细 地 看 一 看 它 。 







来 自 系统 总 线 
的 输入 ( 如 中 断 ) 


来 自 状态 /标志 
寄存 器 的 输入 






循环 计数 器 控制 矩阵 (组合 电 路 ) 


SS 
一 


TRL 
来 自 时 钟 的 输入 


NS 


2 
控制 信号 ( 连接 到 各 
寄存 器 、 数 据 通 路 和 ALU ) 


图 4-17 硬 连 线 控制 单元 示意 图 


第 一 个 基本 组 件 是 指令 译 码 器 。 其 作用 是 产生 与 指令 寄存 器 中 的 操作 码 对 应 的 唯一 输出 信 
号 。 如 果 我 们 有 一 个 四 位 操作 码 ， 则 指令 译 码 器 可 以 有 多 达 16 个 输出 信号 线 。( 为 什么 ?) 
MARIE 指 令 集 的 部 分 译 码 器 如 图 4-18 所 示 。 

a ei 它 为 系统 时 钟 的 每 个 刻度 产生 单个 不 同 的 时 序 
信号 T,。，T,，T,，…，T,。 达 到 T, 后 ,计数 器 循环 回 T,。 执 行 指令 集中 的 任何 指令 所 需 的 最 
站 不同 人 (0 T, 中 的 n 值 )。MARIE 的 计时 器 最 多 计数 7 个 
(T ~ 了 T)， 以 适应 Jns 指令 。( 你 可 以 通过 仔细 检查 表 4-7 来 验证 此 声明 。) 

et in A 的 时 序 逻 辑 电路 称 为 环形 计数 器 。 图 4-19 给 出 了 使 用 D 触 
发 器 构成 的 环形 计数 器 。 开 始 时 ， 触 发 器 的 所 有 输入 都 是 低 电 平 ， 除 了 输入 到 D, 的 信号 (因为 
该 信号 是 对 其 他 和 触发 器 求 或 运算 并 取 反 之 后 得 到 的 值 ) 。 因 此 ， 在 计数 器 的 初始 状态 下 ， 输 出 
T, 被 置 1。 在 下 一 个 时 钟 周期 ，D, 的 输出 变 为 高 电 平 ， 从 而 导致 D, 的 输入 变 为 低 电 平 (由 图 
中 的 或 门 取 反 所 导致 ) 。T 关闭 ，T, 打开 。 可 以 很 容易 看 到 ， 我 们 有 效 地 把 “时 序 位 ”从 D。 





移 到 了 D, 。 该 位 通过 触发 句 的 环 循环 达到 D, ， 除 非 环 首先 通过 时 钟 复 位 信号 Cr 来 复位 。 
操作 码 操作 数 


8 令 寄 存 器 





图 4-18 MARIE 指令 集 的 部 分 指令 译 码 器 


en 











时 钟 
Sn 





To T_T ds = 


图 4-19 使 用 D 触发 器 的 环形 计数 器 


来 自 计 数 器 和 指令 译 码 器 的 信号 在 控制 矩阵 内 组 合 以 产生 涉及 ALU 、 寄 存 器 和 数据 路 径 的 
微 操作 执行 的 一 系列 信和 号。 

无 论 我 们 采用 硬 连 线 控制 还 是 微 程序 控制 ，MARIE Aqq 指令 的 控制 信号 序列 是 一 样 的 。 
如 果 我 们 使 用 硬 连 线 控制 ， 则 机 器 指令 (Adq =0011 ) 中 的 位 模式 直接 馈送 到 控制 单元 内 的 组 
合 逻 辑 。 控 制 单元 启动 我 们 刚刚 描述 的 信号 事件 序列 。 考 虑 图 4-17 所 示 的 控制 单元 。 该 图 中 
最 有 趣 的 部 分 是 指令 译 码 需 与 控制 单元 内 部 逻辑 的 连接 。 时 序 就 好 像 开 启 系统 中 所 有 动作 的 钥 
匙 ， 时 序 信 号 伴随 着 指令 字 中 的 位 信息 产生 所 需要 的 操作 。Adq 指令 的 硬 连 线 逻 辑 如 图 4-20 
所 示 。 你 可 以 看 到 每 个 时 钟 周期 如 何 同 指令 位 进行 “与 ”操作 ， 以 产生 合适 的 信号 。 使 用 每 
个 时 钟 脉 冲 ， 可 以 激活 不 同 的 组 合 逻辑 电路 。 

硬 连 线 控制 的 优点 是 它 的 速度 非常 快 。 缺 点 是 指令 集 和 控制 逻辑 是 通过 难以 设计 和 修改 的 
复杂 电路 直接 连接 在 一 起 实现 的 。 如 果 一 台 计 算 机 是 由 硬 连 线 控 制 的 ， 那 么 要 想 进 行 指令 集 的 
扩充 (就 像 我 们 用 MARIE 一 样 ) ， 就 必须 改变 计算 机 的 物理 组 件 。 这 是 非常 昂贵 的 ， 因 为 不 仅 
需要 制造 新 的 芯片 ， 而 且 还 必须 重新 定位 和 更 换 。 
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i Ns- Ra- Me- Ws: Ra 


图 4-20 ”MARIE 加 法 指令 的 信号 控制 组 合 逻辑 


4. 13.3 微 程序 控制 

言 号 控制 计算 机 系统 中 数据 通路 的 字 节 ( 它 实际 上 是 我 们 解释 为 字 节 的 信和 号 模式 ) 的 移动 。 
产生 这 些 控制 信号 的 方式 是 将 硬 连 线 控制 与 微 程序 控制 区 别 开 来 。 在 硬 连 线 控制 中 ， 来 自 时 钟 
的 时 序 信号 使 用 组 合 逻 辑 电路 进行 “与 ”运算 ， 以 提升 和 降低 信号 。 硬 连 线 控制 会 导致 非常 
复杂 的 逻辑 ， 其 中 基本 轩 辑 门 负责 生成 所 有 控制 字 。 对 于 具有 大 指令 集 的 计算 机 而 言 ， 几 乎 不 
可 能 实现 硬 连 线 控制 。 在 微 程序 控制 中 ， 指 令 微 码 产 生 必要 的 控制 信号 。 微 程序 控制 单元 的 一 
般 框图 如 图 4-21 所 示 。 

所 有 机 器 指令 都 输入 到 名 为 微 程 序 的 特殊 程序 中 ,， 它 将 由 0 和 1 组 成 的 机 器 指令 转换 为 控 
制 信号 。 微 程序 本 质 上 是 一 个 用 微 码 编写 的 解释 器 ， 存 储 在 通常 称 为 控制 存储 器 的 固件 
(ROM、PROM 或 EPROM ) 中 。 在 每 个 时 钟 周 期 内 检索 微 代 码 中 的 微 指令 。 检 索 的 特定 指令 是 
机 器 的 当前 状态 和 微 序 列 器 值 的 函数 ， 这 有 点 类 似 于 从 控制 存储 器 中 选择 下 一 条 指令 的 程序 计 
数 器 。 如 果 MARIE 被 微 程序 化 ， 则 微 指令 格式 可 能 如 图 4-22 所 示 。 

每 个 微 操作 对 应 于 特定 控制 线 可 以 是 活动 的 也 可 以 是 不 活动 的 。 例 如 ， 微 操作 MAR*-PC 
必须 声明 控制 信号 ， 并 将 PC 的 内 容 放 在 数据 通路 上 ， 然 后 将 其 传送 到 MAR( 其 中 包括 提高 
MAR 的 时 钟 信号 以 接受 新 值 ) 。 微 操作 Ac 一 Ac + MBR 产生 用 于 加 法 运算 的 ALU 控制 信号 ， 同 
时 也 使 AC 的 时 钟 接收 新 值 。 微 操作 MBReM[ MAR] 产 生 控 制 信号 ， 以 使 能 存储 在 MAR 地 址 中 
的 正确 存储 器 芯片 (这 包括 用 于 适当 译 码 器 的 多 个 控制 信号 ) ， 将 存储 器 设置 为 READ ， 将 存储 
器 数据 放置 在 数据 总 线 上 ， 并 将 数据 放 和 人 MBR( 这 再 次 要 求 时 序 电 路 要 计时 ) 。 一 个 微 指 令 可 
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能 需要 声明 几 十 (在 复杂 的 架构 中 甚至 为 几 百 或 几 千 ) 条 控制 线 。 这 些 控 制 信号 都 相当 复杂 ， 
因此 ,我们 将 集中 讨论 创建 控制 信号 的 微 操作 ， 而 不 是 控制 信号 本 身 。 假 设 你 已 经 理解 了 在 实 
际 中 执行 这 些微 操作 转化 为 产生 所 有 需要 的 控制 信号 。 可 视 化 所 发 生 内 容 的 另 一 种 方式 是 将 每 
个 微 操 作 与 系统 ( 译 码 器 、 多 路 复 用 器 、ALU 、 存 储 器 、 移 位 器 、 时 钟 等 ) 中 每 个 控制 线 的 一 位 
控制 字 相 关联 。 微 程序 控制 单元 不 是 “执行 ” 微 操 作 ， 而 是 简单 地 定位 与 微 操作 相关 联 的 控 
制 字 ， 并 将 其 输出 到 硬件 。 


来 自 状 态 /标志 
寄存 器 的 输入 





选择 一 个 
特定 的 指令 、、_ 


对 于 给 定 微 
指令 执行 子 程序 


NS 
控制 信号 
图 4-21 微 程序 控制 单元 


Xt 


第 一 个 微 操作 第 二 个 微 操作 a 跳 转 的 目的 地 址 
8 7 6 0 






含义 


位 17 13 这 
图 4-22 ”MARIE 的 微 指 令 格 式 


MicroOpl 和 MicroOp2 是 在 MARIE 指令 集 的 RTN 中 指定 的 唯一 微 操 作 的 二 进 制 代码 。 
这 个 RTN 的 全 部 列表 ( 如 表 4-7 所 示 ) 以 及 对 于 提取 - 解码 -执行 周期 的 RTN 显示 了 实现 MA- 
RIE 整个 指令 集 只 需要 22 个 独特 的 微 操作 ， 还 需要 两 个 额外 的 微 操作 。 其 中 一 个 代码 NOP 表 
示 “ 无 操作 ” 。 当 系统 必须 等 待 一 组 信号 稳定 ,等 待 从 内 存 中 获取 值 ， 或 者 需要 占 位 符 时 ， 
NOP 是 有 用 的 。 第 二 也 是 最 重要 的 ,我 们 需要 一 个 微 操 作 ， 它 可 将 指令 寄存 器 (IR[15-12]) 的 
前 4 位 中 的 位 模式 与 Microop2 字段 的 前 4 位 中 的 字面 值 进行 比较 。 该 指令 对 MARIE 微 程 序 
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的 执行 控制 至 关 重 要 。 每 个 MARIE 微 操作 都 分 配 了 一 个 二 进 制 代 码 ， 如 表 4-9 所 示 。 
表 4-9 微 操作 代码 和 相应 的 MARIE RTL 





































































微 操 作 代码 | 微 操 作 微 操作 代码 微 操 作 
00000 NOP 01101 MBR<*—M[ MAR ] 
00001 RAC<-0 01110 OutREG«—AC 
00010 AC«—MBR OL PC*—IR[11-0] 
00011 AC+—AC - MBR 10000 PC*—MBR 
00100 AC*—AC + MBR 0001 EC 一 PC +1 
00101 ACt-InREG 10010 If 二-AC = 00 
00110 IR+*—M| MAR] 0011 If<«-AC >0 
00111 M[ MAR ] *—MBR 10100 If«-AC<0 
01000 | MARt-IR[11-0] 0101 If«-IR[11-10] =00 
01001 MAR*—MBR 0110 If«-IR[11-10] =01 
01010 MAR*—PC 0 If 一 IR[11-10] =10 
01011 MAR*—X ee If«-IR[15-12] = 
01100 MBR*—AC Microop2[4-1] 

















MARIE 的 整个 微 程序 是 由 不 到 128 个 语句 组 成 的 ， 因 此 每 个 语句 可 以 由 7 位 唯一 标识 。 这 
意味 着 每 个 微 指令 都 有 一 个 7 位 地 址 。 当 Jump 位 置 1 时 ， 表 示 Dest 字段 包含 一 个 有 效 的 地 
址 。 然 后 将 该 地 址 移动 到 微 序 列 器 。 控 制 然后 分 支 到 Dest 字段 中 找到 所 需 的 地 址 。 

MARIE 的 控制 存储 器 将 整个 微 程序 保存 在 连续 的 空间 中 。 该 程序 包括 与 MARIE 的 每 个 操 
作 相 对 应 的 跳 转 表 和 代码 块 。MARIE 微 程序 的 前 九 个 语句 (以 RTL 格式 表示 ) 如 图 4-23 所 示 
(为 了 清晰 起 见 我 们 使 用 RTL， 微 程序 实际 上 是 存储 在 二 进 制 文件 中 的 )。 当 MARIE 启动 时 ， 
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图 4-23 MARIE 微 程序 中 的 选择 语 
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硬件 将 微 序列 器 设置 为 指向 微 程序 的 地 址 0000000 处 。 从 这 个 切入 点 开始 执行 。 我 们 看 到 微 程 
序 的 前 四 个 语句 是 取 指 - 译 码 - 执行 周期 的 前 四 个 语句 。 从 地 址 0000100 开始 包含 “i” 语 
句 ， 它 包含 执行 机 器 指令 的 语句 地 址 的 跳 转 表 。 它 们 有 效 地 通过 将 代码 块 分 支 来 译 码 指令 ， 这 
个 代码 块 设置 控制 信号 以 执行 机 器 指令 。 

在 行 编号 0000111 中 , 语句 If IR[15 -12] =Microop2[4-1] 将 第 二 个 微 操 作 字 段 最 左 
边 4 位 的 值 与 微 程序 前 三 行 获取 的 指令 操作 码 字 段 中 的 值 进行 比较 。 在 这 个 特定 的 语句 中 , 我 
们 将 操作 码 与 执行 Add 操作 的 MARIE 二 进 制 代 码 0011 进行 比较 。 如 果 我 们 匹配 成 功 ， 则 
Jump 位 设置 为 真 ， 控 制 分 支 到 地 址 0101100。 

在 地 址 0101100 处 ,我 们 看 到 Aga 指令 的 微 操 作 ( RTN)。 由 于 执行 了 这 些微 操作 ， 所 以 控 
制 线 的 设置 与 4. 13. 1 节 所 述 完全 相同 。 在 0101110 处 对 于 ada 的 最 后 一 条 指令 ， 再 次 设置 
Jump 位 。 该 位 的 设置 将 使 所 有 0( 跳 转 Dest ) 移动 到 微 序 列 器 。 这 有 效 地 在 程序 顶部 回 到 循环 
开始 。 

我 们 必须 强调 ， 微 程序 控制 单元 的 工作 原理 像 一 个 微型 系统 。 要 想 从 控制 存储 器 中 读 取 指 
令 ， 必 须 给 出 一 些 的 信号 。 微 序列 器 指向 当前 指令 并 随后 递增 。 微 程序 控制 往往 比 硬件 控制 
慢 ， 因 为 所 有 指令 必须 经 过 一 个 额外 的 解释 。 但 微 程序 设计 灵活 ， 设 计 简单 ， 有 助 于 设计 非常 
强大 的 指令 集 。 微 程序 控制 的 最 大 优点 是 ， 如 果 指 令 集 需要 修改 ， 则 仅 需 要 更 新 微 程序 以 匹配 
所 提出 的 要 求 : 不 需要 更 改 硬 件 。 因 此 ， 微 程序 控制 单元 的 制造 和 维护 成 本 较 低 。 由 于 成 本 因 
素 在 消费 产品 中 至 关 重 要 ， 所 以 微 程序 控制 主导 着 个 人 计算 机 的 市 场 。 


4. 14 ”实际 的 计算 机 体系 结构 

本 章 介绍 的 MARIE 体系 结构 是 非常 简单 的 ， 其 目的 是 为 了 便于 读者 理解 计算 机 体系 结 
构 的 基本 概念 ， 这 样 不 会 让 读者 觉得 计算 机 是 一 个 深 不 可 测 的 复杂 系统 。 虽 然 MARIE 体系 
结构 和 汇编 语言 功能 十 分 强大 ， 足 以 解决 使 用 各 种 高 级 语言 (如 C++ 、Ada 或 Java 语言 ) 在 
现代 计算 机 体系 结构 上 实现 的 所 有 问题 。 但 是 ,读者 会 发 现 MARIE 体系 结构 在 工作 效率 、 
编写 程序 的 复杂 性 和 程序 调试 等 方面 都 存在 局 限 性 。 例 如 ， 如 果 通 过 在 MARIE 的 CPU 中 多 
增加 一 些 寄存 器 ， 以 提高 存储 能 力 ， 那 么 MARIE 的 性 能 就 会 获得 显著 提高 。 而 对 于 程序 员 
来 说 ， 使 得 编程 变 得 更 加 容易 是 MARIE 体系 结构 中 另 一 项 需要 改进 的 工作 。 例 如 ，MARIE 
程序 员 非 常 希望 使 用 一 些 带 有 参数 的 过 程 子 程序 。 虽 然 MARIE 可 以 执行 某 些 子 程序 (程序 
可 以 分 支 转移 到 不 同 的 代码 段 ， 执 行 分 支 任务 ， 然 后 返回 等 ) ， 但 是 MARIE 还 没有 一 种 机 
制 来 支持 子 程序 中 参数 的 传递 过 程 。 尽 管 可 以 不 使 用 参数 来 编写 程序 ， 但 是 很 明显 ， 使 用 
参数 不 仅 可 以 提高 程序 的 工作 效率 (特别 是 涉及 重用 的 地 方 ) ， 而 且 更 易于 编写 和 调试 用 使 
程序 。 

为 了 允许 使 用 参数 ，MARIE 需要 增加 一 个 堆 找 结构 。 堆 栈 是 一 种 数据 结构 类 型 ， 它 可 以 
保持 一 系列 的 数据 项 ， 这 些 项 只 能 从 堆栈 的 某 一 端 来 访问 。 放 在 橱柜 中 的 一 蚕 盘 子 类 似 于 一 个 
堆栈 : 正常 情况 下 ， 只 能 往 盘 子 堆 的 上 面 逐一 堆放 盘子 ， 也 只 能 从 盘子 堆 的 顶部 逐次 取 走 盘 
子 。 因 为 这 个 理由 ， 堆 栈 常常 称 为 后 进 先 出 结构 。( 在 本 书 的 附录 给 出 了 各 种 不 同 数据 结构 的 
简要 介绍 。) 

如 果 我 们 对 数据 访问 方式 加 以 限制 ， 则 可 以 利用 主 存储 器 中 的 某 些 存储 单元 来 模仿 一 个 堆 
栈 结构 。 例 如 ， 假 定 把 从 0000 ~ OOFF 的 存储 器 单元 用 作 一 个 堆栈 ， 并 且 将 0000 单元 当 作 堆 栈 
项 。 若 想 将 数据 加 入 (简称 压 入 ) 堆栈 必须 从 堆栈 顶部 开始 ， 而 将 数据 移出 (简称 弹出 ) 堆 栈 也 
必须 从 堆栈 顶部 开始 。 例 如 ， 如 果 要 把 数值 2 压 入 堆栈， 则 数值 2 将 首先 放 到 0000 单元 中 。 
如 果 要 继续 压 人 数值 6， 则 它 会 放 到 0001 单元 。 如 果 堆 栈 执行 弹出 操作 ， 则 首先 会 移出 数值 6。 
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计算 机 使 用 一 个 堆栈 指针 来 记录 应 该 压 和 人 或 弹出 项 的 存放 位 置 。 

MARIE 具备 现代 计算 机 体系 结构 的 许多 特性 。 但 是 ， 由 于 MARIE 过 于 简单 ， 所 以 还 不 能 
对 现代 计算 机 系统 的 这 些 特性 进行 非常 精确 的 描述 。 在 接 下 来 的 两 节 内 容 中 ， 我 们 将 介绍 两 种 
现代 计算 机 体系 结构 ， 以 便 更 好 地 阐明 现代 计算 机 体系 结构 的 各 种 特性 。 当 然 ， 这 里 不 再 讨论 
按照 Leonardo da Vinci 思想 设计 的 简单 的 MARIE。 首 先 要 介绍 Intel 体系 结构 (包括 x86 系列 和 
Pentium 系列 ) ， 然 后 再 讨论 MIPS 体系 结构 。 之 所 以 选择 介绍 这 两 种 体系 结构 ， 是 因为 尽管 它 
们 在 某 些 方面 有 相似 之 处 , 但 是 从 本 质 上 来 说 ,这 两 种 体系 结构 是 建立 在 不 同 设计 思想 之 上 
的 。Intel 体系 结构 中 的 x86 系列 CPU 称 为 CISC (复杂 指令 集 计算 机 ) ， 而 Intel 的 Pentium 系列 
CPU 和 MIPS 体系 结构 则 是 RISC ( 精简 指令 集 计 算 机 ) 的 范例 。 

CISC 机 器 具有 数目 庞大 、 长 度 各 异 和 设计 复杂 的 指令 系统 。 其 中 大 多 数 指令 非常 复杂 ， 
执行 单一 指令 常常 需要 多 个 操作 才能 完成 (例如 ， 可 以 使 用 单个 汇编 语言 指令 执行 循环 ) 。 
CISC 机 咒 所 遇 到 的 基本 问题 是 ， 这 些 复杂 的 CISC 指令 中 的 一 个 小 子 集 就 可 能 显著 减 慢 CPU 的 
运行 速度 。 于 是 , 设计 人 员 又 决定 重新 采用 不 那么 复杂 的 体系 结构 ， 并 且 对 一 些小 但 是 完整 的 
指令 集 实 行 硬 连 线 ， 使 指令 执行 的 速度 变 得 非常 快 。 这 意味 着 计算 机 是 利用 编译 器 来 为 指令 系 
统 (1SA) 生 成 高 效 代码 的 。 采 用 这 种 设计 思想 的 机 器 称 为 RISC 机 器 。 

RISC 在 某 种 程度 上 是 用 词 不 当 的 。RISC 结构 的 指令 数目 的 确 是 减少 了 。 但 是 ，RISC 机 器 
的 主要 目的 是 简化 指令 ， 使 指令 的 执行 速度 更 快 。 在 RISC 系统 中 ， 每 条 指令 只 执行 一 个 操作 ， 
所 有 指令 的 长 度 相同 ， 它 们 只 有 少数 几 种 指令 格式 。 并 且 所 有 的 算术 运算 都 在 寄存 器 之 间 执 
行 ， 存储 器 中 的 数据 不 能 用 作 操 作 数 。 自 从 1982 年 以 来 ， 所 有 新 设计 的 指令 系统 基本 上 都 属 
于 RISC 结构 , 一些 是 CISC 和 RISC 的 某 种 组 合 。 第 9 章 将 详细 讨论 CISC 和 RISC。 


4. 14. 1 Intel 体系 结构 


Intel 公司 生产 了 多 种 不 同体 系 结构 的 CPU 产品 ， 你 可 能 比较 熟悉 其 中 的 某 些 。Intel 公司 
第 一 个 流行 的 芯片 是 8086 芯片 ， 它 于 1979 年 推出 ， 并 且 成 功 地 应 用 在 IBM 的 个 人 计算 机 上 。 
8086 可 以 处 理 16 位 数据 、 寻 址 20 位 地 址 ， 并 且 可 以 寻 址 1M 字 节 的 内 存 。(8086 还 有 一 个 近 
亲 产 品 就 是 8 位 的 8088 芯片 ， 它 应 用 在 许多 个 人 计算 机 上 以 降低 成 本 。)8086 CPU 从 功能 上 分 
为 两 部 分 : 执行 单元 ， 它 包含 通用 寄存 器 和 ALU; 总 线 接 口 单 元 ， 它 包含 指令 队列 、 段 寄存 器 
和 指令 指针 。 

8086 配 有 4 个 16 位 的 通用 寄存 器 ， 分 别称 为 AX( 主 累加 器 ) 、BX( 用 于 扩展 寻 址 的 基 址 寄 
存 器 ) 、CX( 计数 寄存 器 ) 和 DX( 数 据 寄 存 器 ) 。 这 些 寄存 器 中 的 每 一 个 都 分 成 两 个 区 域 : 左边 
的 8 位 被 指定 为 高 位 字 节 (分 别 用 AH、BH、CH 和 DH 表示 ) 而 右边 的 8 位 被 指定 为 低位 字 节 
(分 别 用 AL、BL、CL 和 DL 表示)。 各 种 8086 的 指令 都 使 用 特定 的 寄存 器 ， 但 这 个 指令 寄存 器 
也 可 以 用 作 其 他 用 途 。8086 有 3 个 指针 寄存 器 : 堆栈 指针 (SP) ， 用 来 存放 指示 堆栈 地 址 的 偏 
移 量 ; 基 址 指针 (BP) ， 用 作 压 人 堆栈 的 参考 地 址 参数 ; 指令 指针 (IP)， 用 于 保存 下 一 条 指令 
的 地 址 (类 似 于 MARIE 中 的 程序 计数 器 PC) 。8086 还 有 2 个 变 址 寄存 器 : SI( 源 变 址 ) 寄存 器 ， 
在 字符 串 操作 时 用 作 源 地 址 指针 ; DI( 目的 变 址 ) 寄存 器 ， 用 作 字 符 串 操作 的 目的 地 址 指针 。 
8086 还 配置 了 一 个 状态 标志 寄存 器 ， 其 中 的 不 同位 分 别 指示 不 同 的 状态 ， 如 溢出 、 奇 偶 校 验 、 
进位 和 中 断 等 。 

8086 的 汇编 语言 程序 被 划分 成 不 同 的 段 ， 即 一 些 特殊 的 程序 块 或 区 域 。 它 们 用 来 保留 某 
些 特定 类 型 的 信息 ， 其 中 包括 : 代码 段 (存放 程序 ) 、 数 据 段 (存放 程序 中 的 数据 ) 和 堆栈 段 ( 存 
放 程序 中 的 堆栈 ) 。 如 果 要 访问 任意 段 内 的 信息 ， 需 要 指定 相对 于 该 段 段 首 的 地 址 偏 移 量 。 因 
此 ， 需 要 段 指 针 来 存放 这 些 段 地 址 。 这 些 寄存 器 包括 代码 段 (CS ) 寄存器 、 数 据 段 (DS ) 寄存 器 
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和 堆栈 段 (SS) 寄存 器 。8086 还 有 第 四 个 段 寄 存 器 ， 称 为 附加 段 (ES) 寄存 絮 ， 某 些 字符 串 操 作 
时 它 用 于 存储 器 寻 址 。 存 储 器 地 址 是 采用 段 地 址 /地 址 偏 移 量 的 寻 址 方式 给 出 的 ， 具 体形 式 为 
xxx: yyy。 其 中 ，xxx 是 段 寄存 器 中 的 数值 ， 而 yyy 是 偏 移 量 。 

20 世纪 80 年 代 ，Intel 公司 推出 了 8087， 它 在 8086 机 器 指令 集 的 基础 上 增加 了 浮 点 指令 ， 
还 有 一 个 80 位 宽 的 堆栈 。 在 随后 的 时 间 里 ，Intel 公司 又 发 布 了 许多 新 的 芯片 。 但 是 从 本 质 上 
来 说 ， 这 些 新 的 芯片 与 8086 芯片 具有 相同 的 指令 集体 系 结 构 (ISA) 。 这 些 芯 片 包括 : 1982 年 
推出 的 80286( 可 以 寻 址 16M 字 节 ) 和 1985 年 推出 的 80386( 寻 址 多 达 4G 字 节 )。80386 是 一 个 
32 位 芯片 ， 也 是 8086 系列 中 的 第 一 个 32 位 芯片 ， 通常 称 为 IA-32( 面 向 32 位 的 Intel 体系 结 
构 )。 在 Intel 公司 从 16 位 的 80286 过 渡 到 32 位 的 80386 后 ,设计 人 员 和 希望 这 些 结构 能 够 做 到 
向 后 兼容 ， 即 在 老式 的 功能 较 差 的 处 理 器 上 编写 的 程序 可 以 在 新 型 的 较 快 的 处 理 器 上 运行 。 例 
如 ， 在 80286 上 运行 的 程序 同样 也 可 以 在 80386 上 运行 。 所 以 ，Intel 在 不 断 改 进 中 还 保留 了 相 
同 的 基本 体系 结构 和 寄存 器 组 。( 由 于 在 后 续 的 产品 中 增加 了 许多 新 的 特性 ， 所 以 并 不 能 保证 
芯片 可 以 向 前 兼容 。) 

依据 命名 惯例 ，80386 芯片 在 寄存 器 从 16 位 变 为 32 位 后 ， 对 寄存 器 组 的 命名 又 增加 了 一 
be SS 2 em a , - wy 起 一 一 16 位 一 >< 3 位 了 >< 8 位 > 

、 、 5 EE PH 加 
EBX、ECX 和 EDX。 这 种 命名 惯例 同样 适用 于 其 他 的 | | an | a 
寄存 器 组 。 但 是 ， 对 于 程序 员 来 说 ， 仍 然 可 以 使 用 原 A ; 
来 的 名 称 ( 例 如 AX、AL 和 AH 等) 来 访问 原来 的 寄存 一 一 一 一 一 一 一 正和 谍 二 一 一 一 一 一 一 
器 。 图 4-24 以 AX 寄存 器 为 例 给 出 了 这 种 工作 方式 的 32 位 
示意 图 。 图 4-24 分解 为 几 部 分 的 EAX 寄存 器 

80386 和 80486 都 是 32 位 计算 机 ， 具 有 32 位 数 
据 总 线 。80486 增加 了 一 个 高 速 缓冲 存储 器 ， 这 大 大 提高 了 CPU 的 性 能 。( 详 见 第 6 章 有 关 高 
速 缓冲 存 储 器 和 存储 器 的 讨论 。) 

Intel 公司 从 奔腾 ( Pentium ) 系列 (请 参阅 补充 材料 “Intel 处 理 器 命名 的 含义 是 什么 ?” 以 了 
解 为 什么 Intel( 公司 停止 使 用 数字 并 切换 到 “Pentium” 来 命名 ) ) 开始 推出 Pentium 系列 处 理 
器 。Pentium 处 理 器 具有 32 位 寄存 器 、64 位 数据 总 线 ， 并 采用 了 超标 量 设计 。 这 就 是 说 ， 超 标 
量 的 CPU 可 以 有 多 个 ALU， 并 且 每 个 时 钟 周期 可 以 发 出 多 条 指令 ( 即 多 条 指令 可 以 并 行 执行 ) 。 
Pentium Pro CPU 增加 了 分 支 预测 功能 ， 而 Pentium II 又 增加 了 MMX 技术 来 处 理 多 媒体 事件 ， 
尽管 大 多 数 人 都 认为 这 种 技术 算 不 上 是 一 个 巨大 成 功 。Pentium II 增加 了 对 3D 图 形 处 理 的 支 
持 (使 用 浮 点 指令 ) 。 从 历史 上 来 说 ，Intel 处 理 器 采用 的 都 是 传统 的 CISC 方法 。 直 到 最 近 ， 
Pentium I 和 Pentium II 开始 采用 一 种 组 合 方法 ， 即 运用 具有 RISC 内 核 的 CISC 体系 结构 。 这 
种 结构 可 以 将 CISC 指令 转换 成 RISC 指令 。Intel 公司 也 在 顺应 计算 机 的 发 展 趋势 ,将 CPU 的 
设计 从 CISC 转 到 RISC。 

Intel 公司 推出 的 第 七 代 处 理 器 是 Intel 的 Pentium IV( 也 称 为 Pentium 4) 处 理 器 。IV 处 
理 器 和 Intel 以 前 的 处 理 器 有 很 多 的 不 同 ， 其 中 许多 内 容 超出 了 本 书 的 范围 。 下 面 简 单 介 绍 
几 点 : Pentium IV CPU 的 时 钟 频率 为 1.4GHz 和 1.7GHz，CPV 使 用 了 超过 4200 万 个 晶体 管 ， 
并 且 实 现 了 并 发 ( NetBurst) 微 体系 结构 。( 在 此 之 前 ，Pentium 系列 的 处 理 器 都 是 基于 相同 的 
微 体 系 结构 设计 的 ， 这 里 使 用 微 体系 结构 来 描述 指令 集 下 面 的 体系 结构 。) Pentium IV 处 理 器 
的 这 种 新 结构 由 下 面 几 个 创新 技术 组 成 : 超 流 水 线 ( 有 关 流 水 线 的 内 容 将 在 第 5 章 讨论 ) ， 
可 以 并 发 处 理 多 条 指令 ; 一 个 快速 执行 引擎 (Pentium IV 有 两 个 算术 逻辑 单元 ) ; 一 个 执行 跟 
踪 的 高 速 缓冲 存储 器 ， 它 保存 译 码 后 的 指令 ， 这样 如 果 指 令 再 次 执行 时 不 需要 重新 译 码 ， 
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一 个 频率 为 400MHz 的 系统 总 线 。 这 些 技术 使 IV 处 理 器 在 多 媒体 信息 应 用 方面 的 效果 非 
常 好 。 

Pentium IV 处 理 器 还 引入 了 超 线程 (HT) 。 线 程 是 可 以 在 相同 进程 的 上 下 文中 彼此 独立 运 
行 的 任务 。 线 程 与 父 进程 共享 代码 和 数据 ， 但 具有 自己 的 资源 ， 包 括 堆栈 和 指令 指针 。 由 于 多 
个 子 线程 与 其 父 进程 共享 资源 ， 所 以 线程 需要 的 系统 资源 要 比 每 个 进程 单独 运行 需要 的 资源 
少 。 具 有 多 个 处 理 器 的 系统 通过 拆 分 指令 来 利用 线程 处 理 ， 以 便 多 个 线程 可 并 行 地 在 处 理 器 上 
执行 。 然 而 ，Intel 的 超 线程 使 单个 物理 处 理 器 能 够 模拟 两 个 逻辑 (或 虚拟 ) 处 理 器 一 操作 系 
统 实际 上 会 看 到 两 个 处 理 器 ， 但 其 中 只 有 一 个 存在 。( 为 了 利用 HT， 操 作 系统 必须 能 识别 线程 
处 理 。) HT 通过 对 芯片 资源 (包括 寄存 器 、 数 学 单元 、 计 数 器 和 高 速 缓冲 存储 器 ) 进行 共享 、 复 
制 和 分 区 来 综合 实现 。 

HT 复制 处 理 器 的 架构 状态 ， 但 允许 线程 共享 主 执行 资源 。 这 种 共享 允许 线程 利用 可 能 空 
闲 的 资源 (例如 ， 在 高 速 缓存 未 命中 ) ， 使 资源 利用 率 提高 40% ， 潜 在 的 性 能 提升 高 达 25% 。 
性 能 提升 取决 于 应 用 程序 ， 计 算 密集 型 应 用 程序 可 以 获得 最 大 的 提升 。 常 用 的 程序 ( 如 文字 处 
理 程序 和 电子 表格 ) 大 都 不 受 HT 技术 的 影响 。 


Intel 处 理 器 命名 的 含义 是 什么 ? 


在 当今 的 微型 计算 机 中 ， 大 约 80% 使 用 了 Intel 公司 的 CPU。 这 一 切 都 是 从 4 位 4004 开始 
的 ， 在 1971 年 它 是 第 一 个 可 商 购 的 微 处 理 器 ， 或 者 是 “芯片 上 的 CPU”。4 年 后 ，Intel 的 带 有 
6000 个 晶体 管 的 8 位 8080 被 放 入 第 一 台 个 人 计算 机 Altair 8800 中 。 由 于 技术 允许 每 个 芯片 有 
更 多 的 晶体 管 ，Intel 在 1978 年 推出 了 16 位 的 8086， 在 1979 年 推出 了 8088( 两 者 都 有 大 约 
29 000 个 晶体 管 )。 这 两 台 处 理 器 真正 开启 了 个 人 计算 机 的 革命 ， 因 为 它们 在 IBM 个 人 计算 机 
(后 来 称 为 XT) 中 使 用 ， 并 成 为 行业 标准 。 

80186 于 1980 年 推出 ， 虽 然 买 家 可 以 选择 8 位 或 16 位 版 本 ,但 80186 从 未 在 个 人 计算 机 
中 使 用 。1982 年 ，Intel 推出 了 80286， 它 是 一 个 16 位 处 理 器 ， 具 有 134 000 个 晶体 管 。 在 不 到 
5 年 的 时 间 里 ，1400 多 万 台 个 人 计算 机 正在 使 用 80286( 大 多 数 人 简称 其 为 “286”) 。1985 年 ， 
Intel 推出 了 第 一 款 32 位 微 处 理 器 80386。386 的 多 任务 芯片 立即 取得 了 成 功 ， 其 具有 275 000 
个 晶体 管 和 每 秒 执行 500 万 条 指令 的 运行 速度 。4 年 后 ，Intel 推出 了 80486， 它 的 每 个 芯片 上 
拥有 惊人 的 120 万 个 晶体 管 ， 每 秒 运行 1690 万 条 指令 ! 486 内 置 数学 协 处 理 器 ， 是 第 一 款 真正 
与 大 型 计算 机 相 抗 衡 的 微 处 理 器 。 

有 了 如 此 巨大 的 成 功 和 名 字 的 认可 ， 为 什么 Intel 突然 停止 使 用 80x86 的 命名 规则 ， 并 在 
1993 年 切换 到 Pentium? 那 时 候 ， 许 多 公司 正在 复制 Intel 的 设计 并 使 用 相同 的 编号 方案 。 其 中 
最 成 功 的 一 个 是 Advanced Micro Device(AMD ) 。AMD486 处 理 器 已 经 进入 了 许多 便携 式 计算 机 
和 台式 计算 机 中 。 另 一 个 是 Cyrix 与 其 486SLC 芯片 。 在 推出 下 一 个 处 理 器 之 前 ，Intel 询问 美国 
专利 商标 局 ， 该 公司 是 否 可 以 将 其 命名 为 “586”。 在 美国 ， 不 能 注册 数字 。( 其 他 国家 允许 使 
用 数字 作为 商标 ， 例 如 Peugeot 的 商标 是 3 位 数 型 号 ， 中 位 数 为 零 )。Intel 被 拒绝 其 商标 要 求 ， 
所 以 将 其 名 称 改 为 Pentium。[ 精明 的 读者 会 看 到 ，Pent 就 是 五 的 意思 ， 如 五 角形 (pentagon) 。] 

有 趣 的 是 ， 所 有 这 一 切 发 生 在 Intel 开始 使 用 其 普遍 存在 的 “Intel inside” 商 标的 同一 时 
间 。 更 有 趣 的 是 ，AMD 推出 了 所 谓 的 PR 评级 系统 ， 这 是 一 种 将 x86 处 理 器 与 Intel 处 理 器 进行 
比较 的 方法 。PR 代表 “性 能 评级 ”( 而 不 是 许多 人 认为 的 “Pentium 评级 ”) ， 并 且 间 在 指导 消 
费 者 了 解 与 Pentium 相 比 特定 处 理 器 的 性 能 。 

Intel 继续 使 用 Pentium 命名 方案 制造 芯片 。 第 一 款 Pentium 芯片 拥有 300 万 个 上 晶体管， 每 
秒 可 执行 2500 万 条 指令 ， 时 钟 速度 从 60 ~200MHz。Intel 生产 了 许多 不 同名 称 的 Pentium 处 理 
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器 ， 包 括 1997 年 的 Pentium MMX， 其 使 用 MMX 指令 集 改 进 了 多 媒体 的 性 能 。 

其 他 厂商 也 纷纷 设计 芯片 与 Pentium 产品 竞争 。 为 了 与 Pentium MMX 技术 竞争 ，AMD 推出 
了 AMD5x86 以 及 后 来 的 K5 和 K6。AMD 将 5x86 处 理 器 的 评级 提升 为 “PR75”， 这 意味 着 在 
75MHz 时 该 处 理 器 的 运行 速度 与 Pentium 的 速度 一 样 快 。 为 了 与 Pentium MMX 竞争 Cyrix 推出 
了 6x86 芯片 (或 M1) 和 MediaGX， 其 次 是 Cyrix 6x86MX( M2)。 

Intel 在 1995 年 推出 了 Pentium Pro。 该 处 理 器 拥有 550 万 个 晶体 管 ， 但 是 比 25 年 前 推出 的 
4004 芯片 还 要 小 一 些 。Pentium II(1997) 是 Pentium MMX 和 Pentium Pro 的 结合 ， 包 含 750 万 个 
晶体 管 。AMD 继续 保持 开发 速度 ，1998 年 推出 K6-2， 然后 是 K6-3。 为 了 捕获 更 多 的 低 端 市 
场 ，Intel 推出 了 Celeron， 这 是 Pentium II 的 入 门 级 版 本 ， 具 有 和 较 少 的 高 速 缓存 。 

Intel 在 1999 年 发 布 了 Pentium III。 该 芯片 拥有 950 万 个 晶体 管 ， 使 用 SSE 指令 集 (这 是 
MMX 的 扩展 ) 。Intel 通过 将 高 速 缓存 直接 放 在 内 核 上 来 继续 改进 处 理 器 ， 这 样 使 高 速 缓存 更 
快 。 为 了 与 Pentium III 竞争 ，AMD 于 1999 年 发 布 了 Athlon 芯片 。( 到 目前 为 止 AMD 继续 制造 
Athlon 系列 。) 在 2000 年 ，Intel 发 布 了 Pentium IV， 根 据 具体 的 内 核 不 同 ， 该 芯片 具有 4200 万 ~ 
5500 万 个 晶体 管 。 在 2002 年 发 布 的 Itanium 2 拥有 2.2 亿 个 晶体 管 ， 而 2004 年 发 布 的 新 Itanium 
则 有 5. 92 亿 个 晶体 管 。 到 2008 年 ，Intel 已 经 有 了 Core i7， 它 拥有 7.31 亿 个 晶体 管 。 到 2010 
年 ，Core i7 上 的 晶体 管 数量 已 经 超过 了 10 亿 ! 2011 年 ， 又 发 布 Xeon， 它 包括 超过 20 亿 个 晶 
体 管 ， 其 次 是 在 2012 年 ，Itanium 拥有 超过 30 亿 个 晶体 管 ，xeon 有 超过 50 亿 个 晶体 管 ! 

显然 ， 将 处 理 器 的 名 称 从 x86 更 改 为 基于 Pentium 的 系列 ， 对 Intel 的 成 功 并 没有 产生 负面 
影响 。 然 而 ， 由 于 Pentium 是 处 理 器 世界 中 最 受 认 可 的 商标 之 一 ， 因 此 当 Intel 推出 64 位 Itani- 
um 处 理 器 (不 包括 Pentium) 时， 行业 观察 者 感到 惊 谎 。 有 些 人 认为 这 个 芯片 的 命名 和 这 个 处 理 
器 的 预期 是 相 违背 的 ， 他 们 将 这 款 臣 片 与 沉没 的 船只 进行 比较 ， 从 而 有 人 把 它 称 为 Ttanic( Intel 
的 泰坦 尼克 ) 。 

虽然 这 个 讨论 已 经 给 出 了 Intel 处 理 器 的 时 间 表 ， 但 也 表明 在 过 去 30 年 中 ， 摩 尔 定 律 一 直 
非常 准确 。 这 里 我 们 只 看 了 Intel 和 Intel 克隆 处 理 器 。 还 有 许多 其 他 未 提 及 的 微 处 理 器 ， 包 括 
摩托 罗拉 、Zilog 、TI 和 RCA 制造 的 微 处理 器 ， 这 里 仅 举 几 例 。 随 着 功率 不 断 增加 和 成 本 降低 ， 
毫 无 疑问 ， 微 处 理 器 已 成 为 计算 机 市 场 中 最 流行 的 处 理 器 类 型 。 更 令 人 惊奇 的 是 ， 在 不 久 的 将 
来 ， 这 种 趋势 都 没有 变化 的 迹象 。 


2001 年 Intel 公司 发 布 的 ltanium 处 理 器 标志 着 Intel 的 第 一 个 64 位 世 片 (IA-64) 的 诞生 。 
Itanium 处 理 器 包含 基于 寄存 器 的 编程 语言 和 非常 丰富 的 指令 集 。Itanium 处 理 器 还 使 用 硬件 仿 
真 器 来 保持 其 与 IA-32/x86 系列 指令 集 的 向 后 兼容 性 。Itanium 处 理 器 有 4 个 整数 处 理 单元 、2 
个 浮 点 运算 单元 。Itanium 的 高 速 缓存 容量 也 有 了 大 幅度 提高 ， 并 且 将 高 速 缓存 划分 为 4 个 不 同 
的 级 别 。( 在 第 6 章 中 将 详细 介绍 有 关 高 速 缓存 的 内 容 。) Ianium 处 理 器 配备 128 位 的 浮 点 寄存 
器 和 128 位 的 整数 寄存 器 ， 还 有 其 他 一 些 寄 存 器 用 于 在 分 支 情况 下 处 理 指令 的 有 效 载 人 。Itani- 
um 处 理 器 可 以 对 高 达 16GB 的 主 存储 器 进行 编 址 。Intel 在 2006 年 推出 了 流行 的 “ 核 ” 微 
架构 。 

体系 结构 的 汇编 语言 实际 上 反映 了 体系 结构 的 许多 重要 信息 。 为 了 对 MARIE 的 体系 结构 
与 mtel 的 体系 结构 进行 比较 ， 我 们 再 回 到 例 4. 2 所 示 的 MARIE 程序 ， 即 使 用 一 个 循环 程序 实 
现 5 个 数字 的 相 加 。 现 在 ， 使 用 x86 系列 处 理 器 的 汇编 语言 来 对 例 4. 2 所 示 的 程序 重 写 ， 如 
例 4.6 所 示 。 这 里 要 特别 注意 的 是 ， 一 个 Data 段 指令 和 一 个 code 段 指令 。 

在 Pentium 机 器 上 运行 的 程序 ;该 例 使 用 一 个 循环 结构 来 执行 5 个 数值 的 加 法 
算 。 


mi 
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.DATA 
Numl DD 10 ; Numl :is initialized to 10 
DD 15 ; Each word following Numl is initialized 
DD 20 
DD 25 
DD 30 
Num DB 5 ; Initialize the loop counter 
Sum DB 0 ; Initialize the Sum 
CODE 
LEA EBX, Numl ; Load the address of Numl into EBX 
MOV ECX, Num ; Set the loop counter 
MOV EAX, 0 ; Initialize the sum 
MOV EDI, 0 ; Initialize the offset (of which number to add) 
Start: ADD EAX, [EBX+EDI*4] ; Add the EBXth number to EAX 
INC EDI ; Increment the offset by 1 
DEC ECX ; Decrement the loop counter by 1 
JG Start ; If counter is greater than 0, return to Start 
MOV Sum, EAX ; Store the result in Sum 


同样 也 可 以 使 用 一 个 循环 语句 使 上 面 的 程序 更 易于 阅读 (但 是 这 样 做 会 使 程序 看 起 来 不 太 
像 MARIE 的 汇编 语言 程序 ) 。 从 语法 上 来 说 ,循环 指令 类 似 于 跳 转 指令 ,需要 一 个 标记 符号 。 
将 上 述 程 序 中 的 循环 过 程 重 写 如 下 : 


MOV ECX, Num ; Set the counter 
Start: ADD EAX, [EBX + EDI * 4] 
INC EDI 
LOOP Start 
MOV Sum, EAX 本 


在 x86 系列 处 理 器 的 汇编 语言 中 循环 语句 类 似 于 C、C ++ 或 Java 语言 中 的 do… 
while 语句 结构 。 所 不 同 的 是 ， 这 种 汇编 语言 中 的 循环 语句 并 没有 显 式 的 循环 变量 一 一 
ECX 寄存 器 用 来 保存 循环 的 计数 值 。 每 执行 一 次 循环 指令 ， 处 理 器 就 将 ECX 中 的 数值 减 
1。 然 后 CPU 会 测试 ECX 中 的 数值 是 否 等 于 0。 如 果 ECX 中 的 数值 不 等 于 0， 就 会 控制 程 
序 跳 转 到 start 处 ,再 次 执行 循环 操作 。 如 果 ECX 中 的 数值 等 于 0， 则 终止 循环 。 循环 
语句 是 一 种 可 以 使 程序 员 的 编程 变 得 更 为 方便 的 指令 类 型 ， 但 是 这 类 指令 并 不 是 计算 机 
操作 所 必需 的 指令 。 


4. 14.2 MIPS 体系 结构 


CPU 的 MIPS 系列 是 目前 最 成 功 和 最 灵活 的 设计 之 一 。MIPS R3000、R4000、R5000、 
R8000 和 R10000 就 是 其 中 一 些 属于 MIPS 科技 公司 的 注册 商标 。 除 了 应 用 于 计算 机 系统 (例如 ， 
Silicon 图 形 计算 机 系统 ) 外 ，MIPS 芯片 还 广泛 应 用 于 艇 入 式 系 统 和 计算 机 控制 的 玩具 中 (例如 ， 
Nintendo 和 Sony 公司 在 它们 的 许多 产品 中 都 使 用 MIPS 的 CPU ) 。 另 外 ， 思 科 公 司 是 一 个 非常 
成 功 的 因特网 路 由 器 制造 商 ， 同 样 在 它们 的 产品 中 也 使 用 了 MIPS 的 CPU。 

第 一 代 MIPS 指令 系统 体系 结构 (ISA) 是 MIPS I， 接 下 来 是 MIPS 工 ， 然 后 发 展 到 MIPS V。 
当前 的 MIPS ISA 称 为 MIPS 32( 针 对 32 位 体系 结构 ) 和 MIPS 64( 针 对 64 位 体系 结构 )。 本 节 内 
容 主要 讨论 MIPS 32 结构 。 值 得 注意 的 是 ，MIPS 技术 公司 的 决定 也 类 似 于 Intel 公司 ， 这 就 是 
在 ISA 不 断 发 展 的 过 程 中 ， 始 终 保 持 体系 结构 的 向 后 兼容 性 。 与 Intel 系列 产品 一 样 ， 每 种 新 
ISA 版 本 的 MISP 产品 都 会 对 包括 操作 性 能 和 处 理 指令 系统 在 内 的 诸多 方面 做 出 有 效 改 进 ， 并 
上 且 能 够 有 效 地 处 理 泽 点 数值 。 新 型 的 MIPS 32 和 MIPS 64 体系 结构 在 VLSI 技术 和 CPU 组 成 方 
面 都 有 了 重大 进步 。 相 对 于 传统 的 体系 结构 来 说 ， 这 些 进步 在 提高 CPU 性 能 和 降低 制造 成 本 





上 带 来 了 非常 显著 的 好 处 。 

就 像 mtel 的 IA-32 和 IA-64 一 样 ，MIPS 的 ISA 具有 丰富 的 内 置 指 令 系 统 ， 包 括 算术 运算 指 
令 、 逻 辑 指 令 、 比 较 指 令 、 数 据 转移 指令 、 分 支 指令 、 跳 转 指令 、 移 位 指令 和 多 媒体 指令 等 。 
MIPS 是 一 种 装载 /存储 体系 结构 ， 这 就 是 说 所 有 的 指令 (不 仅仅 是 装载 和 存储 指令 ) 都 必须 使 用 
寄存 器 作为 指令 的 操作 数 ( 不 允许 使 用 存储 器 作为 操作 数 ) 。MIPS32 结构 有 168 条 32 位 的 指 
令 ， 但 是 许多 指令 的 功能 都 很 类 似 。 例 如 ，MIPS 有 6 条 不 同 的 加 法 指令 。 这 6 条 加 法 指令 都 
执行 数值 相 加 的 运算 ， 其 区 别 只 是 所 使 用 的 操作 数 和 寄存 器 各 不 相同 。 在 汇编 语言 的 指令 集 
中 ， 同 一 个 操作 具有 多 条 指令 的 设计 思想 是 非常 普遍 的 。 另 外 一 条 通用 的 指令 是 MIPS 中 的 
NOP 指令 。NOP 指令 并 不 执行 任何 具体 的 操作 ， 只 是 消耗 时 间 而 已 。( 在 第 5 章 中 ， 读 者 将 会 
看 到 NOP 指令 应 用 于 流水 线 操作 中 的 情形 。) 

采用 MIPS 32 体系 结构 的 CPU 具有 32 个 32 位 的 通用 寄存 器 ， 编 号 从 m ~ 呈 1。( 其 中 两 个 
寄存 器 有 着 特殊 的 用 途 : m 通过 硬 线 连接 到 数值 0， 而 31 是 某 些 特定 指令 的 默认 寄存 器 。 也 
就 是 说 ， 在 指令 中 并 不 需要 专门 指定 它 。) 在 MIPS 的 汇编 语言 中 ， 这 32 个 通用 寄存 器 被 分 别 指 
定 为 $80 ，$1 ，…，$31。 寄 存 器 1 保留 ， 寄 存 器 26 和 27 用 于 操作 系统 的 内 核 。 寄 存 器 28 、29 
和 30 为 指针 寄存 器 。 剩 下 的 寄存 器 可 以 通过 编号 来 加 以 引用 ， 这 些 寄存 器 的 命名 约定 如 表 4- 
10 所 示 。 例 如 ， 可 以 使 用 编号 $8 或 $t0 来 引用 寄存 器 8。 


表 4-10 MIPS32 寄存 器 的 命名 约定 









命名 约定 





放 入 寄存 器 中 的 值 

















$v0 — $vl1 结果 、 表 达 式 
$a0 -$a3 4-7 | 依据 

4$t0 -$t7 8-15 | 临时 值 

$s0 -$s7 16-23 | 保存 值 








$t8 -$t9 更 多 的 临时 值 





MIPS 32 的 两 个 专用 寄存 器 是 HI 和 LO， 它 们 用 来 保存 某 些 整数 运算 的 结果 。 当 然 ，MIPS 
也 有 一 个 PC( 程 序 计数 器 ) 寄存 器 ， 所 以 总 共有 3 个 专用 寄存 器 。 

MIPS 32 有 32 个 32 位 的 浮 点 寄存 器 ， 它 们 用 于 单 精 度 浮 点 运算 ( 双 精 度 浮 点 数值 则 按照 奇 = 
偶数 对 的 方式 存储 这 些 寄 存 器 中 ) 。 还 有 为 浮 点 单元 使 用 的 4 个 专用 浮 点 控制 寄存 器 。 

下 面 ， 我 们 通过 使 用 MIPS 的 汇编 语言 来 重新 编写 例 4. 2 和 例 4. 6 所 示 的 程序 ， 从 而 比较 
它们 。 


.data 
# St0O = sum 
# $tl = loop Counter Ctr 
Value: ‘Word 10,15,20,25,30 
Sum = 0 
Ctr = 3 
.text 
.global main # Declaration of main as a global variable 
main: lw $t0, Sum # Initialize register containing sum to zero 
1w -$t1;, Ctr # Copy Ctr value to register 


la $t2, value # St2 is a pointer to current Value 


一 个 菩 单 的 计算 机 模型 MARIE 18]1 





while: blez $tl, end while # Done with loop if counter <= 0 
lw $t3, O(S$t2) # Load value offset of 0 from pointer 
add $t0, $t0, $t3 # Add value to sum 
addi s$t2, S$t2, 4 # Go to next data value 
sub tl EL 和 1 # Decrement Ctr 
b while # Return to top of loop 
la $t4, sum # Load the address of sum into register 
sw St0，0(St4) # Write the sum into memory location sum 


这 种 程序 类 似 于 Intel 中 使 用 的 程序 代码 ， 在 程序 中 循环 计数 器 的 数值 复制 到 一 个 寄存 器 
中 ,每 次 循环 迭代 时 寄存 器 中 的 数值 自动 减 1。 同 时 ，CPU 会 检查 寄存 器 中 的 数值 是 否 小 于 或 
等 于 0。 在 MIPS 体系 结构 中 ， 寄 存 器 的 命名 看 起 来 有 些 复杂 。 但 是 ， 如 果 你 理解 了 这 种 命名 
约定 ， 实 际 使 用 起 来 也 很 方便 。 

如 果 你 喜欢 使 用 MARIE 模拟 器 ， 并 准备 在 更 复杂 的 机 器 上 试 一 下 身手 ， 那 么 你 一 定 能 根 
据 自 己 的 喜好 找到 MIPS 编译 程序 运行 时 模拟 器 ( MARS ) 。MARS 是 一 个 基于 Java 的 可 以 运行 
R2000 和 R3000 的 MIPS 模拟 器 ， 它 是 由 肯 尼 思 … 沃尔玛 和 皮特 桑 德 森 专 为 本 科教 育 设计 的 。 
它 在 一 个 方便 使 用 和 引人入胜 的 图 形 界 面 中 提供 了 所 有 必需 的 MIPS 机 器 功能 。SPIM 是 学 生 
和 专业 人 士 广泛 使 用 的 另 一 种 受 欢迎 的 MIPS 模拟 器 。 这 两 个 模拟 器 都 可 以 免费 下 载 ， 可 以 在 
Windows XP 和 Windows Vista 、Mac 0S X、UNIX 和 Linux 上 运行 。 更 多 信息 请 参阅 本 章 末 尾 的 
参考 文献 。 

如 果 仔 细 研 究 例 4.2、 例 4.6 和 例 4.7， 不 难 发 现 这 些 程序 中 的 指令 非常 相似 。 除 了 调用 
寄存 器 的 方式 不 同和 命名 不 同 外 ， 包 括 的 各 种 操作 基本 上 都 是 相同 的 。 有 些 汇 编程 序 语 言 具 有 
比较 大 的 指令 集 ， 较 大 的 指令 集 可 以 使 程序 员 在 对 不 同 算法 进行 编码 时 有 更 多 的 选择 。 但 是 ， 
正如 我 们 在 MARIE 例子 中 所 见 到 的 ， 一 个 大 的 指令 集 并 不 是 完成 计算 机 各 种 操作 所 必需 的 。 


本 章 小 结 

本 章 曾 述 了 一 个 简单 的 计算 机 体系 结构 MARIE。 学 习 简单 的 MARIE 非常 有 助 于 理解 计算 机 的 取 指 - 
译 码 - 执行 周期 和 计算 机 的 实际 工作 原理 。 这 个 简单 的 体系 结构 具备 一 套 ISA 和 汇编 语言 。 本 章 详 细 介 
绍 了 指令 集 和 汇编 语言 之 间 的 关系 ， 并 且 可 以 利用 这 些 指令 集 和 汇编 语言 为 MARIE 编写 各 种 应 用 程序 。 

CPU 是 计算 机 的 核心 部 件 。CPU 由 数据 通路 和 控制 单元 组 成 。 数 据 通路 包括 若干 个 寄存 器 和 一 个 由 
总 线 连接 起 来 的 ALU。 控 制 单元 负责 对 各 种 操作 和 数据 移动 进行 排序 ， 并 产生 相应 的 时 序 信号 。 计 算 机 
中 的 所 有 部 件 都 要 利用 时 序 信号 来 实现 同步 工作 。 而 VO 子 系统 则 负责 为 计算 机 获取 各 种 数据 信息 或 将 
数据 返回 给 用 户 。 

MARIE 是 一 个 专门 设计 的 非常 简单 的 计算 机 体系 结构 。 利 用 MARIE 模型 可 以 清晰 地 阐明 本 章 中 引 
入 的 各 种 基本 概念 ， 而 又 不 会 陷入 太 多 的 技术 细节 中 。MARIE 机 器 采用 16 位 的 指令 , 并 有 4K 字 长 16 
位 的 主 存储 器 和 7 个 寄存 器 。 其 中 只 有 一 个 通用 寄存 器 ， 即 累加 器 (AC) 。MARIE 指令 使 用 其 中 的 4 位 作 
为 操作 码 ， 而 剩 下 的 12 位 则 表示 地 址 。 本 章 还 引入 了 寄存 器 传输 表示 法 作为 一 种 符号 表示 方法 ， 可 以 在 
寄存 器 层次 上 检查 每 条 指令 所 执行 的 具体 操作 细节 。 

计算 机 运行 程序 所 遵从 的 基本 步骤 是 : 取 指 - 译 码 - 执行 周期 。 首 先 要 进行 提取 指令 的 操作 ， 然 后 
对 指令 译 码 ， 获 取 指 令 所 需要 的 各 种 操作 数 ， 最 后 执行 指令 。 中 断 需 要 在 这 种 循环 过 程 的 开始 处 进行 处 
理 ， 中 断 处 理 完 毕 后 ， 计 算 机 会 返回 正常 的 取 指 - 译 码 -执行 周期 。 

机 器 语言 由 一 系列 二 进 制 数 字 组 成 ， 这 些 二 进 制 数字 所 代表 的 就 是 可 执行 的 各 种 机 器 指令 。 而 汇编 
语言 使 用 助 记 符号 指令 ， 这 些 助 记 符号 指令 代表 的 是 对 应 机 器 语言 中 的 数字 数据 。 汇 编 语言 是 一 种 编程 
语言 ， 但 是 它 并 不 能 为 程序 员 提 供 大 量 的 数据 类 型 或 指令 。 汇 编 语 言 程 序 所 代表 的 是 一 种 低级 (面向 机 
髓 ) 的 编程 方法 。 
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从 某 种 意义 上 来 说 ， 利 用 MARIE 的 汇编 语言 进行 编程 是 件 非常 乏味 的 事情 。 不 难看 出 ， 大 多 数 的 分 
支 程序 都 必须 由 程序 员 利 用 跳 转 语句 和 分 支 转移 语句 来 显 式 地 实现 。 从 汇编 语言 到 高 级 语言 (如 C ++ 或 
Ada) 还 有 相当 大 的 一 段 距 离 。 因 此 ， 编 译 程序 ( 编译 器 ) 就 成 为 一 个 很 好 的 中 间 步 又 ， 利 用 编译 程序 可 以 
将 源 代码 转换 成 机 器 能 够 识别 和 理解 的 指令 。 这 里 的 重点 不 是 介绍 汇编 语言 ， 本 书 的 目的 也 不 是 为 了 让 
读者 更 快 地 掌握 汇编 语言 ， 并 成 为 使 用 汇编 语言 的 程序 员 。 相 反 ， 这 里 引入 汇编 指令 是 为 了 帮助 读者 更 
好 地 理解 计算 机 的 体系 结构 ， 以 及 指令 系统 和 体系 结构 之 间 的 相互 关系 。 汇 编 语 言 的 知识 也 有 助 于 理解 
使 用 各 种 高 级 语言 (如 C ++ 、Java 或 Ada 等 ) 编写 程序 在 执行 过 程 中 ,在 机 器 层 上 所 发 生 的 各 种 具体 操 
作 过 程 。 编 写 x86 系列 和 MIPS 系列 的 汇编 语言 程序 要 比 编写 MARIE 汇编 语言 程序 容易 一 些 。 但 是 ， 相 
对 于 高 级 语言 来 说 ， 编 写 和 调试 汇编 语言 程序 还 是 要 困难 得 多 。 

本 章 介绍 了 Intel 和 MIPS 的 汇编 语言 和 体系 结构 (但 没有 涉及 任何 细节 ) 。 引 入 这 两 种 体系 结构 有 两 
个 原因 : 第 一 ， 对 不 同 的 体系 结构 进行 比较 分 析 是 一 件 令 人 感 兴趣 的 事情 。 我 们 先 从 非常 简单 的 体系 结 
构 出 发 ， 进 而 介绍 一 些 更 加 复杂 和 棘手 的 体系 结构 。 通 过 比较 研究 ， 可 以 更 加 清晰 地 了 解 这 些 体系 结构 
之 间 的 异同 。 第 二 ,虽然 从 形式 上 看 起 来 ，Intel 和 MIPS 的 汇编 语言 与 MARIE 的 汇编 语言 有 很 大 的 不 同 ， 
但 是 在 实际 的 功能 上 它们 却 是 完全 等 效 的 。 它 们 都 包含 一 些 访问 存储 器 和 寄存 器 的 指令 、 移 动 数据 的 指 
令 、 执 行 算术 运算 和 逻辑 运算 的 指令 ， 以 及 一 些 分 支 转移 指令 。MARIE 的 指令 集 非 常 简单 ， 而 且 缺 少许 
多 Intel 和 MIPS 指令 集中 的 所 谓 “ 编 程 用 户 友好 ”的 指令 。Intel 和 MIPS 的 体系 结构 还 比 MARIE 结构 拥 
有 更 多 的 寄存 器 。 除 了 在 指令 的 数目 和 寄存 器 的 数目 方面 存在 着 较 大 的 差别 外 ， 这 三 种 体系 结构 的 语言 
功能 几乎 是 一 样 的 。 


扩展 阅读 

在 本 书 的 主页 可 以 下 载 一 个 MARIE 的 汇编 语言 仿真 器 。 利 用 仿真 器 可 以 编译 和 运行 MARIE 的 程序 。 

有 关 CPU 组 成 原理 和 指令 体系 结构 的 细节 可 以 参阅 Tanenbaum(2013 ) 和 Stallings(2013 ) 的 著作 。 而 
Mano 和 Ciletti(2006 ) 的 著作 中 包含 大 量 有 关 微 程序 体系 结构 的 示例 。Wilkes 、Renwick 和 Wheeler( 1958 ) 
的 文章 也 是 一 篇 很 好 的 有 关 微 程序 设计 的 参考 资料 。 

关于 Intel 汇编 语言 编程 的 更 多 资料 可 以 查阅 Abel(2001) 、Dandamudi( 1998 ) 和 Jones(2001 ) 的 书籍 。 
Jones 的 著作 采用 的 是 一 种 直接 和 简单 的 方法 来 介绍 汇编 语言 编程 。 这 三 本 书籍 的 内 容 都 十 分 详尽 和 深 
入 。 如 果 读 者 对 其 他 汇编 语言 感 兴趣 的 话 ， 则 可 参考 Struble( 1975 ) 的 关于 IBM 汇编 语言 所 著 著 作 ; Gil、 
Corwin 和 Logar( 1987 ) 的 关于 摩托 罗拉 汇编 语言 所 著 著 作 ; SPARC International( 1994 ) 的 关于 SPARC 汇编 
语言 所 著 著作 。 而 要 想 了 解 府 人 式 系统 的 汇编 语言 可 以 尝试 阅读 Williams(2000) 的 书籍 。 

如 果 你 对 MIPS 编程 感 兴趣 ，Patterson 和 Hennessy( 2008 ) 的 著作 是 一 本 很 好 的 参考 书 ， 书 中 的 单独 附 
录 提 供 了 许多 有 价值 的 信息 。Donovan( 1972) 、Goodman 和 Miller( 1993 ) 的 著作 同样 也 很 好 地 介绍 了 MIPS 
的 编程 环境 。Kane 和 Heinrich( 1992 ) 的 著作 无 疑 是 一 本 有 关 MIPS 计算 机 指令 集 和 汇编 语言 程序 的 经 典 教 
科 书 。 读 者 也 可 在 MIPS 公司 的 主页 找到 大 量 的 有 用 信息 。 

要 想 了 解 有 关 Intel 体系 结构 的 更 多 信息 ， 请 参阅 Alpert 和 Avnon(1993) 、Brey(2003 ) 、Dulon( 1998 ) 
和 Samaras(2001 ) 的 书籍 和 文章 。Shanley(1998 ) 的 著作 也 许 是 有 关 Pentium 体系 结构 最 好 的 书 之 一 。 而 有 
关 Motorola 体系 结构 、UltraSparc 体系 结构 和 Alpha 体系 结构 ， 在 Circello 及 其 同事 (1995 ) 、Horel 和 Laut- 
erbach( 1999) 和 McLellan( 1995 ) 的 文章 中 有 相关 的 讨论 。 对 于 高 级 计算 机 体系 结构 的 一 般 性 介绍 ， 请 参 
见 Tabak(1994) 的 著作 。 

要 想 学 习 更 多 有 关 MIPS 体系 结构 中 SPIM 仿真 器 知识 ， 可 参考 Patterson 和 Hennessy( 2008 ) 的 著作 ， 
或 直接 浏览 SPIM 的 主页 ， 其 中 包含 文档 、 手 册 和 各 种 其 他 下 载 资源 。 可 以 从 密苏里 州立 大 学 的 Vollmar 
页 面 :http :和 courses. missouristate. edu/ KenVollmar/ MARS/ 下 载 一 个 很 好 用 的 MARS MIPS 模拟 器 。Waldron 
(1999 ) 的 书籍 是 一 本 很 好 的 有 关 RISC 汇编 语言 编程 和 MIPS 的 导论 。 
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复习 题 


oA 一 


。 CPU 的 功能 是 什么 ? 

. 数据 通路 所 服务 的 目的 是 什么 ? 

. 控制 单元 的 任务 是 什么 ? 

.寄存 器 位 于 何 处 ， 有 哪些 不 同类 型 的 寄存 器 ? 

.ALU 如 何 知 道 将 执行 哪些 功能 ? 

. 为 什么 总 线 通 常 是 计算 机 通信 的 瓶颈 ? 

. 点 对 点 总 线 和 多 点 总 线 有 什么 区 别 ? 

. 为 什么 总 线 协议 很 重要 ? 

. 简 述 数据 总 线 、 地 址 总 线 和 控制 总 线 之 间 的 区 别 。 

. 什么 是 总 线 周期 ? 

. 列 出 3 种 不 同类 型 的 总 线 并 说 明 它 们 在 计算 机 中 的 位 置 。 

. 同步 总 线 和 异步 总 线 有 什么 区 别 ? 

. 总 线 仲裁 的 4 种 方式 是 什么 ? 

. 简 述 时 钟 周期 和 时 钟 频 率 之 间 的 差异 。 

. 系统 时 钟 和 总 线 时 钟 有 何不 同 ? 

. LO 接口 的 主要 功能 是 什么 ? 

. 简 述 存储 器 映射 IO 和 基于 指令 的 LO 之 间 的 区 别 。 

. 字 节 和 字 之 间 有 什么 区 别 ， 如 何 区 分 它们 ? 

. 简 述 按 字 编 址 和 按 字 节 编 址 之 间 的 区 别 。 

. 为 什么 地 址 对 齐 非 常 重要 ? 

. 列 出 并 阐述 两 种 类 型 的 交叉 存储 器 ， 并 说 明 它 们 之 间 的 差异 。 
. 简 述 中 断 的 工作 原理 ， 并 列 出 4 种 不 同 的 中 断 方式 。 

. 如何 区 分 可 屏蔽 中 断 与 不 可 屏蔽 中 断 ? 

. 若 MARIE 有 4K 字 的 主 存储 器 ， 则 地 址 为 什么 必须 有 12 位 ? 
. 阐述 MARIE 寄存 器 的 所 有 功能 。 

. 什么 是 操作 码 ? 

. 阐述 在 MARIE 中 每 个 指令 的 工作 原理 。 

. 机 器 语言 与 汇编 语言 有 什么 不 同 ? 它们 之 间 是 否 存在 一 一 对 应 的 关系 (一 个 汇编 指令 等 于 一 个 机 器 语 


言 指令 )? 


. RTN 有 什么 重要 性 ? 

. 一 个 微 操作 和 一 条 机 器 指令 是 同一 回 事 吗 ? 

. 微 操 作 与 常规 汇编 语言 指令 有 什么 不 同 ? 

. 阐述 取 指 - 译 码 - 执行 周期 的 各 个 步骤 。 

. 简 述 由 中 断 驱 动 MO 是 如 何 工作 的 。 

. 阐述 汇编 程序 的 工作 原理 ， 包 括 它 如 何 生成 符号 表 ， 如 何 使 用 源 代码 和 目标 代码 以 及 如 何 处 理 标 记 


符号 。 


. 什么 是 嵌入 式 系 统 ? 它 与 常规 计算 机 系统 有 什么 不 同 ? 

. 描述 例 4. 1 所 示 程 序 的 详细 执行 过 程 ( 类似 于 图 4-14 所 示 的 内 容 ) 。 
. 阐述 硬 线 控制 和 微 程 序 控制 之 间 的 区 别 。 

. 什么 是 堆栈 ?为 什么 堆栈 对 编程 很 重要 ? 

. 试 比较 CISC 机 器 和 RISC 机 器 有 何不 同 。 

.Intel 的 体系 结构 与 MIPS 有 什么 不 同 ? 

. 分 别 列 出 4 种 Intel 处 理 器 和 4 种 MIPS 处 理 器 。 
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习题 


下 


CPU 的 主要 功能 是 什么 ? 


2. ALU 与 CPU 之 间 有 什么 关系 ， 它 们 的 主要 功能 是 什么 ? 
3. 当中 断 发 生 时 ,阐述 CPU 应 该 做 什么 ? 包括 CPU 应 如 何 检测 中 断 、 继 而 如 何 处 理 以 及 如 何 为 中 断 


4 4. 


4 10. 


11. 
12. 


13. 


14. 


服务 ? 
需要 多 少 位 来 寻 址 2M x32 主 存 ， 当 
a) 主 存 是 按 字 节 编 址 的 ? b) 主 存 是 按 字 编 址 的 ? 


. 需要 多 少 位 来 寻 址 4M x16 主 存 ， 当 


a) 主 存 是 按 字 节 编 址 的 ? b) 主 存 是 按 字 编 址 的 ? 


。 寻 址 1M x8 主 存 需要 多 少 位 ， 当 


a) 主 存 是 按 字 节 编 址 的 ? b) 主 存 是 按 字 编 址 的 ? 


. 不 使 用 低位 交叉 编 址 而 是 使 用 高 位 交叉 编 址 ， 重 做 例 4. 1。 
. 假设 我 们 有 4 个 主 存 模块 ， 而 不 是 如 图 4-6 和 图 4-7 所 示 的 8 个 ， 请 绘制 主 存 模块 及 其 地 址 : 


a) 高 位 交叉 编 址 b) 低位 交叉 编 址 


. 要 想 提 供 4096 字 节 的 存储 容量 ， 则 需要 多 少 片 256 x8 RAM 芯片 ? 


a) 每 个 地 址 包含 多 少 位 ? 
b) 每 个 芯片 需要 多 少 根 连接 线 ? 
c) 为 了 选择 芯片 的 输入 ， 译 码 器 需要 多 少 行 输入 ? 请 指定 译 码 器 的 大 小 。 
假设 使 用 256K x8 RAM 芯片 构建 一 个 2M x 16 主 存 ， 其 中 存储 器 是 按 字 编 址 的 。 
a) 需要 多 少 片 RAM 芯片 ? 
b) 访问 一 个 完整 的 字 ， 将 涉及 多 少 片 芯片 ? 
c) 每 个 RAM 芯片 需要 多 少 个 地 址 位 ? 
d) 这 个 存储 器 有 多 少 个 存储 体 ? 
e) 所 有 存储 器 需要 多 少 个 地 址 位 ? 
f) 如 果 使 用 高 位 交叉 编 址 ， 地 址 14( 十 六 进 制 为 E) 的 存储 单元 位 于 什么 位 置 ? 
假设 使 用 512KB x8 RAM 芯片 构建 一 个 16MB x 16 的 存储 器 ， 重 做 习题 10。 
假设 我 们 使 用 高 位 交叉 编 址 使 用 1G x 16 RAM 芯片 组 成 一 个 32G x 64 的 存储 器 。( 注意 : 这 意味 着 每 
个 字 的 大 小 为 64 位 ， 并 且 有 32G 个 字 。) 
a) 需要 多 少 片 RAM 芯片 ? 
b) 假设 每 个 存储 体 中 有 4 个 芯片 ， 则 需要 多 少 个 存储 体 ? 
c) 每 个 芯片 需要 多 少 根 连接 线 ? 
d) 假设 存储 器 地 址 是 按 字 寻 址 的 ， 则 需要 多 少 根 地 址 线 ? 
e) 根据 d) 中 的 答案 ， 画 出 示意 图 ， 并 指出 需要 多 少 位 和 哪些 位 用 于 片 选 ， 以 及 使 用 多 少 位 和 哪些 字 
用 于 芯片 地 址 。 
f) 假设 使 用 低位 交叉 编 址 ， 重 做 此 题 。 
假设 在 设 数字 计算 机 的 存储 单元 中 每 个 字 有 24 位， 指令 集 由 150 个 不 同 的 指令 组 成 。 所 有 指令 都 有 
一 个 操作 代码 部 分 (操作 码 ) 和 一 个 地 址 部 分 (只 有 一 个 地 址 ) 。 每 条 指令 存储 在 一 个 存储 字 中 ， 请 问 : 
a) 操作 码 需要 多 少 位 ? 
b) 指令 的 地 址 部 分 还 有 多 少 位 ? 
c) 允许 的 最 大 存储 容量 是 多 少 ? 
d) 在 一 个 存储 字 中 可 容纳 的 最 大 无 符号 二 进 制 数 是 多 少 ? 
假设 在 数字 计算 机 的 存储 单元 中 每 个 字 有 32 位 ， 指 令 集 由 110 个 不 同 的 指令 组 成 。 所 有 指令 都 有 一 
个 操作 码 部 分 (操作 码 ) 和 两 个 地 址 字段 : 一 个 是 存储 器 地 址 ， 一 个 是 寄存 器 地 址 。 该 特定 系统 包括 8 
个 通用 的 、 用 户 可 寻 址 的 寄存 器 。 寄 存 器 可 以 直接 从 存储 器 加 载 数据 ， 并 且 存 储 器 可 以 直接 利用 寄 
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存 器 更 新 。 不 支持 存储 器 到 存储 右 的 数据 移动 操作 。 每 条 指令 存储 在 一 个 字 长 的 存储 单元 中 。 
a) 操作 码 需 要 多 少 位 ? 
b) 需要 多 少 位 来 指定 寄存 器 ? 
c) 指令 的 存储 地 址 部 分 剩余 多 少 位 ? 
d) 存储 器 所 允许 的 最 大 容量 是 多 少 ? 
e) 在 一 个 存储 字 中 可 容纳 的 最 大 无 符号 二 进 制 数 是 多 少 ? 
15. 假设 有 一 个 2” 字 节 的 存储 器 。 
4 a) 如 果 存 储 器 是 按 字 节 编 址 的 ,那么 最 低 和 最 高 地 址 是 什么 ? 
*b) 如 果 存 储 器 是 按 字 编 址 的 ， 设 字 长 为 16 位 ， 那么 最 低 和 最 高 地 址 分 别 是 什么 ? 
c) 如 果 存 储 器 是 按 字 编 址 的 ， 设 字 长 为 32 位 ， 那么 最 低 和 最 高 地 址 分 别 是 什么 ? 
16. 假设 某 个 计算 机 的 RAM 具有 256M 字 ， 其 中 每 个 字 的 长 度 是 16 位 。 
a) 这 个 内 存单 元 以 字 节 表示 的 容量 为 多 少 ? 
b) 如 果 该 RAM 是 按 字 节 编 址 的 ， 则 地 址 必须 包含 多 少 位 ? 
c) 如 果 该 RAM 是 按 字 编 址 的 ， 则 地 址 必须 包含 多 少 位 ? 

17. 你 和 同事 正在 设计 一 个 全 新 的 微 处 理 器 架构 ， 你 的 同事 希望 处 理 器 可 以 支持 509 种 不 同 的 指令 ， 但 
你 不 这 么 认为 ， 你 希望 有 更 少 的 指令 。 向 最 终 可 以 决定 的 管理 团队 概述 你 的 论点 并 尝试 写 出 反对 观 
点 的 论据 。 

18. 给 定 一 个 由 64 x8 RAM 芯片 组 成 的 2048 字 节 的 存储 器 ， 并 假定 存储 器 是 按 字 节 编 址 的 ， 下 列 7 幅 图 
中 哪 一 个 是 使 用 地 址 位 的 正确 方式 ?为 什么 ? 

> 
a) 

扫 一 一 一 一 一 一 一 一 64 位 地 址 一 一 一 一 一 一 一 一 > 
b) 

OOO > 
EC 

二 一 6 位 地 址 一 一 一 一 一 一 一 一 > 
d) 

OO > 
6) 

OO 
f) 

搜 一 一 一 一 一 一 64 位 地 址 一 一 一 一 一 一 一 > 
g) 


19. 阐述 CPU 的 取 指 - 译 码 -执行 周期 的 各 个 步骤 ,请 详细 说 明 各 个 寄存 器 的 变化 过 程 。 
20. 结合 在 图 4-11 和 图 4-12 中 出 现 的 流程 图 ， 使 中 断 检查 出 现在 合适 的 位 置 。 


21. 


22. 


9 23. 


25. 


ba 


27. 
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解释 在 MARIE 中 ， 为 什么 MAR 寄存 器 是 12 位 ， 而 AC 寄存 器 的 宽度 是 16 位 。( 提示 
地 址 之 间 的 差异 。) 
列 出 以 下 程序 对 应 的 十 六 进 制 代码 (并 对 程序 进行 编译 ) 。 


十 六 进 制 地 址 ”标号 指令 

100 LOAD A 
101 ADD ONE 
102 JUMP S1 
103 82, ADD ONE 
104 STORE A 
105 HALT 

106 S1， RDD A 
107 JUMP S2 
108 R， HEX 0023 
109 One, HEX 0001 


对 于 上 述 程序 写 出 符号 表 中 的 内 容 。 


. 根据 下 面 的 MARIE 程序 : 


a) 列 出 每 条 指令 的 十 六 进 制 代码 。 
b) 绘制 符号 表 。 
c) 在 程序 终止 时 ， 存 储 在 AC 中 的 值 是 多 少 ? 


十 六 进 制 地 址 ”标号 缘 令 

100 Start， LOADA 
101 ADD B 
102 STORE D 
103 CLERR 
104 OUTPUT 
105 ADDI D 
106 STORE B 
107 HALT 

108 R， HEX 00FC 
109 B, DEC 14 
10A @; HEX 0108 
10B D, HEX 0000 
根据 下 面 的 MARIE 程序 : 


a) 列 出 每 条 指令 的 十 六 进 制 代码 。 
b) 绘制 符号 表 。 
c) 在 程序 终止 时 ， 存 储 在 AC 中 的 值 是 多 少 ? 


十 六 进 制 地 址 标号 指令 

200 Begin, LOAD Base 
201 ADD Offs 
202 Loop, SUBT One 
203 STORE Addr 
204 SKIPCOND 800 
205 JUMP Done 
206 JUMPI Addr 
207 CLEAR 

208 Done, HALT 

209 Base, HEX 200 
20A QFES, DEC 9 

20B One, HEX 0001 
20C Addr, HEX 0000 


a) 0010000000000111 b) 1001000000001011 c) 00110000000010 


编写 以 下 MARIE 机 器 语言 指令 的 汇编 语言 : 


a) 0111000000000000 b) 1011001100110000 c) 01001111010011 


: 考虑 数据 和 


. 假设 已 知 本 章 介绍 的 MARIE 指令 集 ， 解 密 以 下 MARIE 机 器 语言 指令 ( 写 出 等 效 的 汇编 语言 指令 ) : 


01 


下 主 


29. 


31 


32. 
33. 


36. 
37. 
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. 编写 以 下 MARIE 机 器 语言 指令 的 汇编 语言 ; 


a) 0000010111000000 b) 0001101110010010 ec) 1100100101101011 
用 MARIE 的 汇编 语言 编写 以 下 代码 段 : 
if X > 1 then 
Y= XX + XK? 
X= 0; 
endif,; 
Ye 韦 工 ; 


. 用 MARIE 的 汇编 语言 编写 以 下 代码 段 : 


if x <= Y then 
.i 

LSge 站 -和 t= 
then Y= Y= 1 


else z=2z+1; 


判断 一 下 : 如 果 有 如 下 代码 片段 (执行 某 个 子 程序 ) 在 MARIE 机 器 上 运行 ， 可 能 会 出 现 什 么 潜在 问题 
(可 能 多 于 一 个 问题 ) ? 这 个 子 程序 假设 要 传递 的 参数 存放 在 AC 中 ,并且 应 该 将 该 参数 值 加 倍 。 程 
序 的 主体 部 分 包括 一 个 调用 子 程序 的 例子 。 可 以 假定 这 个 程序 片段 是 某 个 大 程序 的 一 部 分 。 

Main, Load 性 


Jump Subl 
Sret, Store X 


Subl, Add XxX 
Jump Sret 


写 一 个 MARIE 程序 来 计算 表达 式 AxB+CxD。 
用 MARIE 汇编 语言 编写 以 下 代码 段 : 
-I 
while X < 10 do 
0 


endwhile; 


. 用 MARIE 汇编 语言 编写 以 下 代码 段 。( 提示 : 把 for 循环 转换 成 while 循环 。) 


Sum = 0; 
for XX 二 上 七 10 do 


Sum = Sum + X; 


. 使 用 循环 编写 MARIE 程序 ， 通 过 重复 相 加 将 两 个 正 数 相 乘 。 例 如 ， 乘 法 3 x6， 程序 将 执行 6 次 加 


法 , 或 3+3+3+3+3+3。 

写 一 个 MARIE 子 程序 实现 两 个 数字 相 减 。 

链表 是 由 一 组 节点 构成 的 线性 数据 结构 ， 除 最 后 一 个 节点 以 外 ， 每 一 个 节点 都 指向 列表 中 的 下 一 个 节 
点 。 (附录 提 供 了 有 关 链 表 的 更 多 信息 。) 假 设 我 们 有 如 下 图 所 示 的 5 个 节点 的 集合 。 这 些 节 点 已 经 被 创 
建 并 放置 在 MARIE 程序 中 ， 编 写 一 个 MARIE 程序 以 遍历 列表 并 按 每 个 节点 的 存储 顺序 打印 数据 。 





MARIE 程序 的 片段 : 
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38. 


39. 


45. 


47. 





(地 址 ) 标号 
十 六 进 制 
00D Addr, Hex ???? / Top of list pointer: 
/ You fill in the address of Nodel 
00E Node2, Hex 0032  / Node's data is the character \27 
O00F Hex ???? / Address of Node3 
010 Node4, Hex 0034 / Character “4” 
011 Hex ???? 
012 Nodel, Hex 0031 / Character “1” 
013 Hex ???? 
014 Node3, Hex 0033 / Character “3" 
015 Hex ???? 
016 Node5, Hex 0035 / Character “Ss” 
017 Hex 0000 / Indicates terminal node 


使 用 更 多 寄存 器 有 利于 提高 CPU 的 工作 速度 ， 因 为 增加 寄存 器 的 数目 可 以 减少 程序 访问 存储 器 的 总 
次 数 。 列 举 一 个 算法 例子 来 证 明 上 述 观 点 。 首 先 ， 使 用 MARIE 确定 需要 访问 存储 器 的 次 数 ， 并 且 利 
用 两 个 寄存 器 来 保存 来 自 存储 器 的 数据 值 ( AC 和 MBR ) 。 然 后 ， 对 于 一 个 处 理 器 执行 与 上 面相 同 的 
算法 计算 ， 这 个 处 理 器 多 于 3 个 寄存 器 来 保存 存储 器 数据 。 

es 个 子 程序 的 返回 地 址 保存 在 存储 器 中 ， 存 储 单元 的 位 置 由 Jns 指令 来 指定 。 在 一 些 体系 
结构 中 ， 这 个 返回 地 址 存储 在 寄存 器 中 ,大 多 数 情况 下 它 存 储 在 堆栈 中 。 哪 种 方法 最 适合 处 理 循环 
递归 ? RE (提示 : 递归 意味 着 有 许多 子 程序 的 调用 。) 


. 编写 一 个 执行 3 个 基本 堆栈 操作 的 MARIE 程序 : 压 人 、 查 看 和 弹出 ( 按 顺序 ) 。 在 查看 操作 中 ， 输 出 


堆栈 顶部 的 值 。( 如 果 你 不 熟悉 堆栈 ， 请 参阅 附录 以 了 解 更 多 信息 。) 


. 跟踪 描述 例 4. 3 所 示 程 序 的 详细 执行 过 程 (类 似 于 图 4-14 所 示 的 跟踪 ) 。 
42. 
43. 


跟踪 描述 例 4. 4 所 示 程 序 的 详细 执行 过 程 (类 似 于 图 4-14 所 示 的 跟踪 ) 

假设 我 们 给 MARIE 指令 集 添 加 下 面 的 指令 : 

IncS2Z Operand 

该 指令 的 作用 对 有 效 地 址 的 “操作 数 ” 进 行 增 量 操作 ， 如 果 最 新 的 增 量 值 等 于 0， 则 程序 计数 器 加 


1。 基 本 上 ， 我 们 对 操作 数 进 行 增 量 处 理 ， 如 果 这 个 新 值 等 于 0， 则 跳 过 下 一 条 指令 。 说 明 如 何 使 用 
RTN 编写 这 条 指令 。 


. 假设 我 们 给 MARIE 的 指令 集 添加 下 面 的 指令 : 


JumpOffset Xx 

该 指令 将 跳 转 到 的 地 址 是 通过 将 给 定 地 址 X 和 累加 器 中 的 内 容 相 加 得 到 的 地 址 。 说 明 如 何 使 用 RTN 
编写 这 条 指令 。 
假设 我 们 添加 下 面 的 指令 给 MARIE 的 指令 集 : 


JumpIOffset X 


该 指令 将 跳 转 到 地 址 X， 然 后 将 在 那里 找到 的 值 加 到 AC 中 。 说 明 如 何 使 用 RTN 编写 这 条 指令 。 

. 使 用 图 4-15 所 示 的 格式 绘制 MARIE 的 PC 与 数据 通路 之 间 的 连接 。 

下 表 提供 了 MARIE 数据 通路 的 控制 信号 的 摘要 。 使 用 此 信息 ， 参 照 表 4-9 和 图 4-20， 绘 制 MARIE 中 
Load 指令 的 控制 逻辑 。 








寄存 器 
信号 


P,Pi Po (Read) 














111 
Ps Ps Pi; (Write) 


. 习题 47 中 的 表 提 供 了 MARIE 数据 通路 的 控制 信号 的 摘要 。 使 用 此 信息 ， 参 照 表 4-9 和 图 4-20， 绘制 


49. 


S0. 


Sl 


52. 


63， 





MARIE 中 JumpI 指令 的 控制 逻辑 。 

习题 47 中 的 表 提 供 了 MARIE 中 数据 通路 的 控制 信号 的 摘要 。 使 用 此 人 信息， 参照 表 4-9 和 图 4-20， 绘 
制 MARIE 的 StoreI 指令 的 控制 逻辑 。 

假设 一 些 系统 控制 单元 具有 由 一 定数 目的 D 触发 器 组 成 的 一 个 环 ( 循 环 ) 计 数 器 。 该 系统 运行 在 
1CHz， 最 多 有 10 个 微 操 作 / 指 令 。 

a) 每 个 触发 器 输出 的 最 大 输出 频率 (信号 脉冲 数 ) 是 多 少 ? 

b) 执行 只 需要 4 个 微 操 作 的 指令 需要 多 长 时 间 ? 

假设 你 正在 为 一 个 小 型 计算 设备 设计 硬 线 控 制 单元 。 这 个 系统 是 创新 性 的 ， 系 统 设计 人 员 为 它 设计 
了 一 个 全 新 的 指令 系统 架构 。 因 为 一 切 都 是 新 的 ， 所 以 你 正在 考虑 在 周期 计数 器 中 包括 一 个 还 是 两 
个 额外 的 触发 器 和 信号 输出 。 讨 论 一 下 你 想 如 何 设计 ? 说 明理 由 。 

基于 习题 51 中 提出 的 想法 ,假设 MARIE 具有 硬 线 控制 单元 ， 并且 我 们 决定 添加 一 个 需要 8 个 时 钟 周 
期 来 执行 的 新 指令 。( 这 是 一 个 比 执行 时 间 最 长 的 指令 jns 的 周期 更 长 的 指令 。) 为 了 适应 这 种 新 指令 ， 
简要 讨论 我 们 需要 进行 哪些 修改 。 


. 使 用 图 4-16 所 示 的 格式 绘制 MARIE 中 Load 指令 的 时 序 图 。 

. 使 用 图 4-16 所 示 的 格式 绘制 MARIE 中 subt 指令 的 时 序 图 。 

. 使 用 图 4-16 所 示 的 格式 绘制 MARIE 中 aaaz 指令 的 时 序 图 。 

. 使 用 表 4-9 给 出 的 编码 ， 将 图 4-23 所 示 的 助 记 符 微 操作 码 指令 转换 为 二 进 制 微 代码 ( 表 中 的 前 九 行 ) 。 
. 继续 习题 56, 为 Jump X、Clear 和 addaI X 指令 写 出 MARIE 的 微 代码 跳 转 表 ( 对 目标 值 使 用 全 1 ) 。 

.参考 图 4-23 ， 为 MARIE 中 的 Load 指令 编写 二 进 制 微 代码 。 假 设 微 代 码 开始 的 指令 行 号 为 0110000, 。 
. 参考 图 4-23， 为 MARIE 中 的 aaa 指令 编写 二 进 制 微 代 码 。 假 设 微 代码 开始 的 指令 行 号 为 0110100, 。 

. 在 CPU 和 存储 器 之 间 你 会 推荐 使 用 一 个 同步 总 线 还 是 异步 总 线 ? 为 什么 ? 


一 个 体系 结构 (本 章 所 述 的 体系 结构 除外 ) 进行 研究 ， 以 了 解 该 体系 结构 如 何 处 理 本 章 中 介绍 的 
概念 ， 就 像 Intel 和 MIPS 一 样 。 


. 在 执行 JumpI 指令 的 每 个 步骤 时 ， 下 列 哪些 控制 信号 应 该 包含 一 个 1? 





步 蝇 re EE bar 
i i 
























取 指 令 MAR*—PC 
IR+*—M[ MAR] 

译 码 IR[ 15-12] PC+—PC +1 

取 操 作 数 MAR<*—IR[11-0] 

执行 MBR<-M[ MAR] 
PC*—MBR 




























IRt-M[ MAR] 








PC 一 RC +1 






































译 码 IR[ 15-12] MAR<*—IR[11-0] 
取 操 作 数 MBR*—M[ MAR] 
执行 MAR*—MBR 中 
MBR*—AC 
| M[ MAR ] 二 MBR | 
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64. 在 每 个 读 取 周期 结束 时 (为 下 一 条 指令 进行 准备 ) 执 行 PCt-PC +1 微 操作 。 然 而 ， 如 果 我 们 执行 一 个 


Jump 或 者 一 个 JumpI 指令 ， 则 会 用 一 个 新 的 值 来 覆盖 PC 中 的 值 ， 从 而 替换 PC +1 的 微 操 作 。 说 明 
如 何 修改 MARIE 的 微 程序 使 得 它 在 这 方面 效率 更 高 。 


是 非 题 


1. 


8. 
9 


如 果 计 算 机 使 用 硬 线 控制 ， 则 微 程序 决定 机 器 的 指令 集 。 除 非 重 新 设计 体系 结构 ， 否 则 永远 不 能 更 改 
此 指令 集 。 


. 一 个 分 支 指令 是 通过 改变 PC 来 改变 信息 流 的 ， 
. 寄存 器 是 CPU 本 身 的 存储 单元 。 
. 一 个 两 次 通读 ( two- pass) 的 编译 程序 ， 一 般 是 在 第 一 次 通读 源 程序 时 生成 一 个 符号 表 ， 并 且 在 第 二 次 


通读 时 完成 从 汇编 语言 到 机 器 语言 的 全 部 转换 。 


. MARIE 中 的 MAR、MBR、PC 和 IR 寄存 器 可 用 于 保存 任意 数据 值 。 
. MARIE 有 一 个 共同 的 总 线 配 置 ， 这 意味 着 许多 实体 共享 这 条 总 线 。 
. 一 个 编译 器 是 一 个 程序 ， 这 个 程序 接受 符号 语言 程序 ， 并 生成 一 个 等 效 的 二 进 制 机 器 语言 程序 ， 在 汇 


编 语 言 的 源 程序 和 机 器 语言 的 目标 程序 之 间 会 产生 一 一 对 应 的 关系 。 
如 果 计 算 机 使 用 微 程序 控制 ， 则 微 程序 决定 机 器 的 指令 集 。 
一 个 字 的 长 度 决定 了 存储 器 地 址 需要 的 位 数 。 


10. 如 果 存 储 器 是 16 路 交叉 ， 则 意味 着 可 以 使 用 4 个 存储 区 来 实现 存储 (因为 2 =16) 。 
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仔细 审视 指令 集 架构 


5 引言 

在 第 4 章 中 我 们 已 经 知道 机 器 指令 由 操作 码 和 操作 数组 成 。 操 作 码 指明 机 器 指令 要 执行 的 
操作 ， 而 操作 数 指出 指令 执行 所 需要 的 数据 是 存放 在 寄存 器 中 还 是 内 存 中 。 为 什么 当 我 们 使 用 
诸如 C ++ 、Java、Ada 等 高 级 语言 的 时 候 ， 我 们 还 要 关注 机 器 指令 呢 ? 在 使 用 高 级 语言 编程 的 
时 候 ， 我 们 几乎 不 会 注意 本 章 或 第 4 章 讨 论 的 这 些 问题 ， 这 是 由 于 高 级 语言 对 程序 员 隐 藏 了 指 
令 集 架 构 的 实现 细节 。 雇 主 之 所 以 倾向 于 雇佣 有 汇编 语言 背景 的 工程 师 ， 并 不 是 因为 他 们 需要 
汇编 语言 程序 员 ， 而 是 他 们 需要 有 理解 计算 机 体系 结构 的 人 来 写 出 更 高 效 的 程序 。 

在 本 章 ， 我 们 将 对 上 一 章 的 内 容 进行 扩展 ， 以 使 你 对 指令 集 架构 有 更 深入 的 了 解 。 我 们 会 
讨论 不 同 的 指令 类 型 和 操作 数 类 型 ， 以 及 指令 如 何 访问 内 存 中 的 数据 。 你 将 看 到 指令 集 的 多 样 
性 被 累积 起 来 用 以 区 分 不 同 的 计算 机 体系 结构 。 理 解 指令 集 的 设计 和 运行 有 助 于 理解 计算 机 体 
系 结构 中 更 错综复杂 的 细节 。 


5.2 指令 格式 

我 们 知道 一 条 机 器 指令 由 一 个 操作 码 以 及 零 个 或 多 个 操作 数组 成 。 在 第 4 章 ， 我 们 看 到 
MARIE 有 的 指令 长 度 为 16 位 并 且 最 多 有 一 个 操作 数 。 指 令 集 编码 有 多 种 方法 可 以 选择 。 我 们 
可 以 通过 每 条 指令 允许 的 字 长 (16 位 、32 位 、64 位 或 更 长 ) 、 每 条 指令 包含 的 操作 数 的 个 数 、 
指令 类 型 以 及 每 条 指令 能 够 处 理 的 数据 来 区 分 指令 集 架构 。 更 确切 地 说 ， 不 同 的 指令 集 可 以 通 
过 以 下 特征 进行 区 分 : 

。 操作 数 的 存储 位 置 (数据 可 以 存放 在 堆栈 或 寄存 器 中 ， 或 者 两 者 都 有 ) ; 

。 每 条 指令 包含 的 显 式 操 作 数 的 个 数 (一 般 都 是 0、1、2 以 及 3 个 ) ; 

e 操作 数 的 位 置 (指令 分 为 寄存 器 - 寄存 器 型 、 寄 存 器 - 存储 器 型 ， 或 者 存储 器 - 存储 器 

型 ， 这 简单 指明 了 每 条 指令 中 人 允许 的 操作 数 的 位 置 组 合 ) ; 
e 操作 (不 仅 包 含 操作 类 型 ， 也 规定 了 哪些 指令 可 以 访问 内 存 以 及 哪些 不 能 ) ; 
。 操作 数 的 类 型 和 大 小 (操作 数 可 以 是 地 址 、 数 值 ， 甚 至 字符 ) 。 


5.2.1 指令 集 设 计 决策 
当 计 算 机 体系 结构 处 于 设计 阶段 时 ， 必 须 首先 确定 指令 集 的 格式 。 选 择 一 种 格式 经 常 是 很 
困难 的 一 个 决定 ， 因 为 指令 集 必须 和 计算 机 体系 结构 相 匹 配 ， 并 且 一 个 好 的 体系 结构 往往 会 持 
续 使 用 数 十 年 。 故 设计 阶段 的 决策 会 产生 持久 的 影响 。 
指令 集 架 构 是 由 以 下 几 个 因素 来 衡量 的 :(1) 程 序 占 用 空间 的 大 小 ; (2) 指 令 集 的 复杂 程 
度 ， 它 根据 执行 指令 所 需 译 码 的 数量 和 由 指令 实现 功能 的 复杂 程度 ; (3 ) 指 令 的 长 度 ; (4) 指 
令 的 总 条 数 。 在 设计 指令 集 时 ， 需 要 考虑 以 下 几 个 方面 : 
e 通常 ， 短 指令 更 好 一 点 ， 因 为 它们 占用 更 少 的 内 存 空间 并 且 可 以 快速 地 从 内 存 中 读 取 出 
来 。 但 这 也 限制 了 指令 的 数量 ,原因 就 是 指令 中 应 该 有 足够 多 的 位 数 来 指定 我 们 需要 的 
指令 数 。 较 短 的 指令 对 操作 数 的 个 数 和 大 小 有 更 严格 的 要 求 。 
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e 定 长 指令 的 译 码 相 对 容易 但 浪费 存储 空间 。 

e 内 存 组 织 影响 指令 格式 。 如 果 内 存 是 16 位 字 或 32 位 字 的 并 且 不 是 按 字 节 编 址 的 ， 则 很 
难 存 取 单个 字符 。 也 正 因 为 这 个 原因 ， 所 以 尽管 计算 机 有 16 位 、32 位 或 64 位 字 ， 但 通 
常 都 是 使 用 字 节 编 址 方式 ， 这 意味 着 尽管 存储 字 长 大 于 1 字 节 ， 但 每 一 个 字 节 都 会 有 一 
个 唯一 的 地 址 。 

。 在 定 长 指令 中 操作 数 的 个 数 并 非 固定 不 变 的 。 我 们 可 以 设计 一 个 有 足够 长 度 且 长 度 固定 
的 指令 集 架构 ， 但 允许 操作 数字 段 的 位 数 是 可 变 的 。( 这 称 为 扩展 操作 码 ， 我 们 将 在 
5. 2.5 中 进行 详细 介绍 。) 

e 寻 址 方式 有 多 种 类 型 。 在 第 4 章 中 ，MARIE 系统 使 用 了 两 种 寻 址 方式 : 直接 寻 址 和 间 
接 寻 址 ; 本 章 我 们 会 看 到 更 多 不 同 种 类 的 寻 址 方式 。 

。 如 果 字 包含 多 个 字 节 ， 那 么 在 字 节 编 址 的 机 器 中 按照 什么 样 的 顺序 来 存放 这 些 字 节 ? 低 
字 节 是 存放 在 低 字 节 地 址 中 还 是 高 字 节 地 址 中 ? 接 下 来 的 章节 中 将 会 分 析 大 端 方 式 和 小 
端 方式 的 优 缺 点 。 

。 架构 中 包含 多 少 个 寄存 器 ， 并 且 这 些 寄存 器 该 如 何 组 织 ? 操作 数 如 何 存放 在 CPU 中 ? 

下 面 的 部 分 将 深入 讨论 大 端 方式 和 小 端 方式 、 扩 展 操作 码 和 CPU 中 寄存 器 的 组 织 问题 。 

在 讨论 这 些 问 题 的 过 程 中 ， 我 们 也 会 接触 到 其 他 的 设计 问题 。 


5.2.2 小 端 和 大 端 方式 


术语 端 引 用 的 是 计算 机 体系 结构 中 的 “ 字 节 顺序 ”或 者 计算 机 存储 多 字 节 数据 的 方法 。 
实际 上 ， 所 有 的 现代 计算 机 都 是 而 且 也 必须 是 字 节 编 址 的 ， 因 此 ， 对 存储 多 个 单字 节 的 信息 制 
定 了 标准 。 有 些 计 算 机 存储 双 字 节 整 数 ， 比 如 ， 先 存储 最 低 有 效 字 节 ( 放 在 低地 址 ) ， 接 着 再 
存储 最 高 有 效 字 节 。 因 此 低地 址 中 的 字 节 具有 和 较 低 的 显著 性 。 这 种 机 絮 就 叫 作 小 端 计算 机 。 男 
一 种 机 器 则 相反 ， 先 存储 最 高 有 效 字 节 ( 放 在 低地 址 ) ， 然 后 再 存储 最 低 有 效 字 节 。 这 种 将 最 
高 有 效 字 节 存放 在 最 低地 址 的 方式 称 为 大 端 方式 。 大 多 数 UNIX 采取 的 都 是 大 端 方式 ， 而 个 人 
计算 机 则 大 多 采用 小 端 方式 。 大 多 数 RISC 架构 的 计算 机 采用 大 端 方式 。 

大 端 和 小 端 这 两 个 术语 出 自 《 格 列 佛 游记 》 一 书 。 你 可 能 还 记得 这 个 故事 ， 利 立 浦 特 ( 小 人 
国 中 的 人 ) 根 据 吃 鸡 蛋 时 从 大 的 一 头 还 是 小 的 一 头 打破 ， 将 人 分 成 了 两 个 阵营 : 大 端 派 和 小 端 
派 。 而 CPU 制造 商 在 如 何 存储 数据 上 也 分 成 了 两 个 派系 。 比 如 说 ，Intel 总 是 使 用 小 端 方式 存 
放 数 据 ， 而 Motorola 总 是 使 用 大 端 方式 。( 值得 注意 的 是 ， 有 些 CPU 既 能 处 理 大 端 方式 也 能 处 
理 小 端 方式 。) 

下 面 通过 举例 来 说 明 大 端 和 小 端 方式 。 假 设 一 个 整 型 数据 需要 4 字 节 : 


在 小 端 机 器 上 ， 内 存单 元 会 按照 如 下 方式 排列 : 


基地 址 +0 = 字 节 0 
基地 址 +1 = 字 节 1 
基地 址 +2 = 字 节 2 
基地 址 +3 = 字 节 3 


而 在 大 端 机 器 上 ， 内 存单 元 会 按照 如 下 方式 排列 : 


基地 址 +0 = 字 节 3 
基地 址 +1 = 字 节 2 
基地 址 +2 = 字 节 1 
基地 址 +3 = 字 节 0 





假设 某 台 计算 机 采用 字 节 编 址 方式 ， 已 知 一 个 32 位 的 十 六 进 制 数 12345678 存储 在 地 址 从 
0 开始 的 内 存单 元 中 。 每 一 位 十 六 进 制 数 字 都 需要 半 个 字 节 来 表示 ， 因 此 一 个 字 节 可 以 表示 两 
位 十 六 进 制 数 。 图 5-1 所 示 为 这 个 十 六 进 制 数 在 内 存 中 的 存储 情形 ， 其 中 ， 带 阴影 的 小 方 格 代 
表 内 存 中 的 实际 内 容 。 例 5.1 给 出 了 在 内 存 中 多 个 连续 数据 分 别 以 大 端 和 小 端 方式 存储 的 示 
意图 。 
地 址 ( 向 右 增加 ) 一 一 一 > 00 10 11 


te 
小 端 方式 站 
图 5-1 十 六 进 制 数 12345678 的 大 端 和 小 端 存储 方式 


假设 某 台 计算 机 可 表示 32 位 整数 。 让 我 们 看 一 下 整数 0xABCD1234 、0x00FE4321 、 


0x10 在 内 存 中 是 如 何 依次 存储 的 ， 假 设 在 内 存 中 存放 第 一 个 整数 的 起 始 地 址 为 0x200， 每 一 个 
地 址 存放 一 个 字 节 。 























字 节 顺序 
地 址 大 端 方式 a 小 端 方式 
0x200 AB 0x206 加 FE 
0x201 CD 12 0x207 21 00 
0x202 位 | CD 0x208 00 10 
0x203 34 AB 0x209 00 00 
0x204 00 21 0x20A 00 00 
0x205 FE 43 0x20B 10 00 




















我 们 注意 到 当 使 用 大 端 存储 方式 时 ， 十 六 进 制 整数 0xABCD1234 从 起 始 地 址 0x200 开始 按 
照 从 左 到 右 的 顺序 很 自然 地 就 读 出 来 了 ; “AB” 是 这 个 整数 的 高 位 字 节 ， 紧 接着 是 CD、12 
最 后 是 34。 但 是 对 小 端 方式 来 说 ， 对 同一 个 整数 0xABCD1234， 在 地 址 0x200 中 存放 的 是 最 低 
有 效 字 节 ( 即 34)。 注 意 , 我 们 在 小 端 方式 中 没有 将 这 个 数 存 储 为 43、21、DC、BA 的 形式 ; 
因为 这 仅仅 是 数字 位 的 颠倒 ， 而 非 字 节 。 再 次 强调 ， 小 端 方式 和 大 端 方式 是 指 字 节 的 顺序 不 
同 ， 而 不 是 数字 位 顺序 的 不 同 。 还 要 注意 到 ， 最 后 一 个 数 0x10 在 存储 时 ， 我 们 将 它 填充 为 
0x00000010。 这 是 因为 这 个 整数 是 32 位 的 ， 故 不 足 32 位 时 需要 在 高 位 补 0。 < 

每 种 方法 都 有 优点 和 缺点 ， 因 此 一 种 方法 并 不 一 定 比 男 一 种 方法 好 。 大 端 方式 更 符合 大 多 
数 人 的 习惯 , 更 易于 读 取 十 六 进 制 数 。 首 先 读 出 高 位 字 节 ， 在 偏 移 量 为 0 时， 通过 观察 这 个 字 
节 可 以 判断 出 它 是 正 数 还 是 负数 。( 与 之 相 比 ， 小 端 方式 首先 需要 知道 数据 的 字 节 数 ， 然 后 通 
过 偏 移 量 定位 到 最 高 地 址 ， 才 能 获取 数字 的 符号 ) 。 大 端 机 器 用 相同 的 顺序 存放 整 型 数据 和 字 
符 串 ， 在 操作 某 些 字符 串 时 ， 速 度 会 更 快 一 些 。 大 多 数位 映像 图 形 采 用 “最 高 有 效 位 在 左边 ” 
的 方案 进行 映射 ， 这 就 意味 着 对 大 于 1 字 节 的 图 形 元 素 进行 操作 时 可 以 由 计算 机 体系 结构 本 身 
来 处 理 。 对 于 小 端 模式 的 计算 机 来 说 这 是 一 种 性 能 限制 ， 因 为 当 处 理 大 的 图 形 对 象 时 ， 需 要 连 
续 不 断 地 反 转 字 节 顺序 。 当 对 采用 压缩 编码 的 数据 进行 译 码 时 [ 比如 赫 夫 曼 编码 和 LZW 编码 
(在 第 7 章 中 讨论 ) ] ， 如 果 采 用 大 端 方式 (实际 情况 也 大 多 如 此 ) 时 ， 实 际 码 字 可 以 当 作 查找 表 
的 索引 来 使 用 。 

然而 ， 大 端 方式 也 有 缺点 。 当 从 32 位 整 型 地 址 转换 为 16 位 整 型 地 址 时 ， 需 要 大 端 计算 机 
实现 加 法 。 小 端 计 算 机 实现 高 精度 的 算术 运算 更 快速 且 更 容易 。 大 多 数 使 用 大 端 存储 方式 的 体 
系 结构 不 允许 字 被 写 到 不 是 按 字 编 址 的 边界 上 ( 比如 ， 如 果 一 个 字 包 含 2 字 节 或 4 字 节 ， 则 它 
的 地 址 就 必须 从 偶数 字 节 开始 ) 。 这 显然 会 浪费 存储 空间 。 小 端 架构 ( 比如 Intel) 允许 奇 地 址 的 
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读 写 ， 这 样 就 会 使 编程 很 简单 。 如 果 程 序 员 写 了 一 条 指令 来 读 取 错误 字 地 址 上 存储 的 非 零 值 ， 
在 大 端 机 器 上 会 读 到 一 个 不 正确 的 值 ， 而 在 小 端 机 器 上 ， 有 时 候 则 会 读 出 正确 的 结果 。( 注意 
Intel 最 终 增加 了 一 条 指令 来 反 转 寄存 器 中 的 字 节 顺序 。) 

计算 机 网 络 采 用 大 端 方式 ， 这 意味 着 当 小 端 计算 机 通过 网 络 传输 整数 时 ( 比如 说 网 络 设备 
的 地 址 )， 需 要 将 整数 转换 为 网 络 字 节 顺序 。 同 样 地 ， 当 计算 机 接收 到 网 络 上 传输 过 来 的 整 型 
数据 时 ， 需 要 将 这 些 数据 转换 回 原 有 的 表示 形式 。 

尽管 你 可 能 还 不 熟悉 大 端 和 小 端 方式 的 区 别 ， 但 是 它 对 于 当前 的 很 多 软件 应 用 程序 来 说 却 
是 很 重要 的 。 任 何 需 要 读 写 文件 的 程序 都 必须 清楚 特定 计算 机 的 字 节 顺序 。 比 如 说 ，Windows 
BMP 图 像 格 式 是 在 小 端 机 器 上 开发 的 ， 因 此 若 想 在 大 端 机 器 上 查看 BMP 图 像 ， 浏 览 图 像 的 应 
用 程序 就 必须 先 反 转 字 节 顺序 。 常 用 软件 的 设计 人 员 必 须 熟 知 字 节 顺序 的 问题 。 比 如 ，Adobe 
Photoshop 使 用 大 端 方式 、GIF 采用 小 端 存储 、JPEG 采用 大 端 存 储 方式 、MacPaint 是 大 端 方式 、 
PC Paintbrush 是 小 端 方式 、 微 软 的 RTF 软件 是 小 端 方式 的 ， 而 Sun 栅 格 文件 是 大 端 方式 。 有 些 
应 用 程序 既 支持 大 端 方式 也 支持 小 端 方式 。 比 如 ， 微 软 的 WAV 和 AVI 文件 、TIF 文件 和 XWD 
(X Windows Dump ) ， 就 是 通过 将 标识 符 编码 到 文件 中 的 方法 来 支持 上 述 两 种 存储 顺序 的 。 


5.2.3 CPU 内 部 的 存储 : 堆栈 和 寄存 器 


一 旦 数据 在 内 存 中 的 存储 顺序 确定 了 ， 硬 件 设 计 者 就 必须 决定 CPU 如 何 存储 数据 。 这 是 
区 分 ISA 最 基本 的 方法 。 通 常 有 以 下 3 个 选择 : 

e 堆栈 型 架构 

e 累加 器 型 架构 

e 通用 寄存 器 ( GPR ) 型 架构 

堆栈 型 架构 使 用 一 个 堆栈 来 执行 指令 ， 操 作 数 隐 式 地 存放 在 栈 顶 。 尽 管 基于 堆栈 结构 的 机 
需 有 良好 的 代码 密度 和 简单 的 表达 式 求 值 模型 ， 但 不 能 随机 访问 一 个 堆栈 ， 故 难以 产生 高 效 的 
代码 。 另 外 ,在 执行 指令 时 ， 堆 栈 结构 成 为 了 一 个 瓶颈 。 累 加 器 型 架构 比如 MARIE 系统 ， 有 
一 个 操作 数 隐 式 地 存放 在 累加 器 中 ， 这 可 以 最 小 化 机 器 的 内 部 复杂 度 ， 并 且 人 允许 设计 非常 短 的 
指令 。 但 是 由 于 累加 器 仅 供 暂 时 存储 数据 ， 故 使 得 内 存 通信 量 非常 高 。 使 用 寄存 器 集合 的 通用 
寄存 器 型 架构 广泛 地 被 现代 计算 机 体系 结构 所 采纳 。 寄 存 器 的 工作 速度 比 内 存 快 很 多 ， 编 译 器 
也 易于 处 理 ， 因 此 可 有 效 且 高 效 地 使 用 。 另 外 ， 硬 件 价格 已 经 明显 下 降 ， 使 得 以 极 低 成 本 增加 
大 量 的 寄存 器 成 为 可 能 。 如 果 内 存 访问 速度 快 ， 基 于 堆栈 的 设计 将 会 是 一 个 很 好 的 想法 ; 反 
之 ， 还 是 使 用 寄存 器 更 好 一 些 。 这 也 是 在 过 去 的 十 年 当中 ,大 多 数 计算 机 采用 基于 通用 寄存 器 
型 架构 的 原因 。 然 而 ， 由 于 所 有 的 操作 数 都 必须 被 命名 ， 所 以 在 长 指令 中 使 用 寄存 器 会 引起 较 
长 的 取 指 和 译 码 时 间 。(1ISA 设计 者 的 一 个 非常 重要 的 目标 是 设计 短 指令 ) 。 设 计 者 在 选择 某 种 
ISA 后 必须 判断 其 能 否 在 特定 环境 下 工作 良好 ， 并 且 应 进行 仔细 权衡 。 

根据 操作 数 存放 的 位 置 ， 可 以 将 通用 架构 分 为 3 类。 存储 器 - 存储 器 型 架构 可 能 有 2 个 或 3 
个 位 于 内 存 中 的 操作 数 ， 人 允许 指令 实现 任何 操作 数 都 不 存放 在 寄存 器 中 的 操作 。 寄 存 器 - 存储 器 
型 架构 需要 混合 存储 ， 其 中 至 少 一 个 操作 数 在 寄存 器 中 ， 男 一 个 操作 数位 于 存储 器 中 。 取 - 存 架 
构 在 实现 对 数据 进行 操作 之 前 ， 需 要 将 数据 传送 到 寄存 器 中 。Intel 和 Motorola 采用 寄存 器 - 存 
储 器 型 架构 ; Digital Equipment 的 VAX 架构 采用 存储 器 - 存储 器 型 操作 ; SPARC、MIPS、Alpha 
和 POWER PC 则 完全 采用 取 - 存 架 构 。 

考虑 到 当今 大 多 数 的 计算 机 体系 结构 都 采用 基于 通用 寄存 器 的 方法 ， 所 以 我 们 现在 考察 能 
够 划分 通用 寄存 器 架构 的 两 种 指令 集 的 特性 。 这 两 种 特性 分 别 是 操作 数 的 个 数 和 操作 数 的 寻 址 
方式 。 在 5.2.4 节 中 ， 我们 讨论 指令 长 度 和 指令 中 包含 的 操作 数 个 数 。(2 个 或 3 个 操作 数 是 
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GPR 架构 中 常用 的 ， 我 们 将 它们 和 和 零 操 作 数 及 单 操作 数 的 架构 进行 比较 。) 接 下 来 我 们 将 讨论 
指令 类 型 。 最 后 ,在 5.4 节 ， 我 们 将 讨论 多 种 寻 址 方式 。 


5.2.4 操作 数 个 数 和 指令 长 度 

描述 计算 机 体系 结构 的 传统 方法 是 指定 每 条 指令 中 操作 数 或 地 址 的 最 大 个 数 。 这 对 指令 本 
身 的 长 度 有 着 直接 影响 。MARIE 系统 使 用 定 长 指令 ， 它 包括 4 位 操作 码 和 12 位 操作 数 。 当 前 
的 体系 结构 使 用 的 指令 可 以 分 为 两 种 格式 : 

。 定 长 指令 

5.5 节 将 会 对 此 进行 介绍 。 

。 变 长 指令 一 一 译 码 更 复杂 但 是 节省 存储 空间 。 

一 般 情况 下 ,实际 的 折 中 方案 是 使 用 两 种 或 三 种 指令 长 度 ， 它 们 通过 位 组 合 模式 来 区 分 并 
可 使 译 码 简 化 。 指 令 长 度 必 须 和 机 器 字 长 相对 应 。 如 果 指 令 长 度 完全 等 于 机 器 字 长 ， 那 么 指令 
存放 在 主 存 中 就 可 以 完全 对 齐 。 基 于 寻 址 的 原因 ， 指 令 往往 需要 按照 存储 字 来 对 齐 。 因 此 ， 那 
些 半 字 、 四 分 之 一 字 、 双 字 或 者 三 倍 字 长 的 指令 会 浪费 存储 空间 。 变 长 指令 的 字 长 明显 不 同 ， 
它们 也 需要 进行 字 对 齐 ， 当 然 也 会 导致 存储 空间 的 浪费 。 

最 常用 的 指令 格式 有 零 地 址 、 单 地 址 、 双 地 址 或 三 地 址 指令 。 在 第 4 章 中 ,我 们 看 到 MA- 
RIE 架构 中 的 一 些 指令 没有 操作 数 ， 而 其 他 指令 有 一 个 操作 数 。 算 术 和 导 辑 运算 指令 通常 有 两 
个 操作 数 ， 但 如 果 其 中 一 个 隐 式 地 存放 在 累加 器 时 ， 单 操作 数 指令 也 可 以 执行 ( 见 MARIE ) 。 
如 果 将 目的 操作 数 视 为 第 三 个 操作 数 时 ， 这 一 思想 可 以 扩展 到 三 地 址 指令 。 我 们 可 以 对 零 地 址 
指令 使 用 堆栈 。 下 面 是 几 种 常用 的 指令 格式 : 

e 仅 有 操作 码 ( 零 地 址 指令 ) 

e 操作 码 + 一 个 地 址 (通常 使 用 一 个 内 存 地 址 ) 

。 操作 码 + 两 个 地 址 (通常 使 用 两 个 寄存 器 地 址 ， 或 者 一 个 寄存 器 地 址 和 一 个 内 存 地 址 ) 

。 操作 码 + 三 个 地 址 (使 用 三 个 寄存 器 地 址 ， 或 者 寄存 器 地 址 和 内 存 地 址 的 组 合 ) 

所 有 的 指令 集 架 构 都 会 限制 指令 中 允许 操作 数 的 最 大 个 数 。 例 如 ， 在 MARIE 中 ， 操 作 数 
的 最 大 个 数 是 1， 而 有 些 指令 没有 操作 数 (Halt 指令 和 Skipcond 指令 ) 。 我 们 注意 到 ， 零 操 
作 数 、 单 操作 数 ， 双 操作 数 和 三 操作 数 指令 是 最 常见 的 类 型 。 后 三 种 类 型 易于 理解 ， 而 完全 基 
于 零 操 作 数 指令 创建 的 指令 集 架 构 会 令 人 感到 困惑 。 

没有 操作 数 的 机 器 指令 必须 使 用 堆栈 (堆栈 是 一 种 后 进 先 出 的 数据 结构 ， 所 有 的 插入 和 删 
除 都 必须 针对 栈 项 进行 。 堆 栈 的 内 容 在 第 4 章 中 介绍 过 ， 在 附录 中 也 有 详细 的 描述 ) 来 在 逻辑 
上 实现 需要 一 个 或 两 个 操作 数 的 运算 (比如 Ada)。 一 个 基于 堆栈 的 指令 集 架 构 不 使 用 通用 寄 
存 器 ， 它 在 栈 顶 存储 操作 数 ， 栈 项 是 CPU 可 以 访问 的 。( 值得 注意 的 是 ,堆栈 是 计算 机 体系 结 
构 中 一 个 非常 重要 的 数据 结构 。 它 不 仅 能 够 在 复杂 的 运算 时 方便 地 存 取 立即 数 ， 还 为 在 过 程 调 
用 中 传递 参数 提供 了 一 种 简便 方法 ， 当 然 也 为 保存 局 部 块 结构 以 及 定义 变量 和 子 程序 的 作用 域 
提供 了 一 种 方法 。) 

在 基于 堆栈 的 架构 中 ， 大 多 数 指令 仅 包含 操作 码 。 但 也 有 一 些 特殊 指令 (那些 需要 在 栈 顶 
加 上 一 个 值 然 后 再 删 掉 栈 顶 元 素 的 指令 ) 包 含 一 个 操作 数 。 栈 架构 需要 push 和 pop 指令 ， 这 
两 条 指令 都 允许 带 一 个 操作 数 。Push x 将 内 存单 元 中 的 地 址 为 X 内 容 读 出 放 到 栈 顶 ，Pop Xx 
将 栈 顶 元 素 写 到 内 存 地 址 为 X 的 存储 单元 中 。 仅 特定 指令 可 以 访问 内 存 ， 其 他 所 有 指令 在 执行 
时 如 果 需 要 操作 数 必须 使 用 堆栈 。 

对 需要 两 个 操作 数 的 运算 指令 来 说 ， 它 会 取出 栈 顶 的 两 个 元 素 。 举 例 说 明 ， 如 果 执 行 AdG 
指令 ， 则 CPU 会 把 栈 顶 的 两 个 元 素 相 加 ， 首 先 把 它们 都 弹出 然后 将 相 加 所 得 的 和 压 人 到 栈 顶 。 





流水 线 时 ， 它 具有 更 优 的 性 能 ， 在 
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对 于 减法 这 种 不 可 交换 的 指令 来 说 ， 用 次 栈 顶 元 素 减 去 栈 顶 元 素 ， 也 是 将 这 两 个 元 素 都 弹出 ， 
然后 将 相 减 所 得 的 差 值 压 入 到 栈 顶 。 
堆栈 架构 对 于 求解 用 逆 波 兰 式 ( RPN) 书写 的 长 算术 表达 式 是 很 有 效 的 ， 道 波兰 式 是 波兰 
数学 家 鲁 卡 谢 维 奇 (Jan Lukasiewicz) 在 1924 年 发 明 的 。 这 种 表达 式 将 操作 符 放 在 操作 数 之 后 ， 
又 名 后 缀 表达 式 ; 与 此 对 应 ， 还 有 中 缀 表达 式 ( 即将 操作 符 放 在 操作 数 之 间 ) ; 以 及 前 缀 表达 
式 (波兰 式 ) (即将 操作 符 放 在 操作 数 之 前 ) 。 下 面 举例 说 明 。 
不 + 了 是 中 级 表达 式 
+XY 是 前 级 表达 式 
XY+ 是 后 级 表达 式 
当 使 用 后 级 表达 式 ( 即 逆 波兰 式 ) 时， 在 任意 表达 式 中 ,每 一 个 操作 符 都 紧 跟 在 它 所 属 的 
操作 数 后 面 。 如 果 当 表达 式 中 多 于 一 种 运算 时 ， 操 作 符 紧 跟 在 第 二 个 操作 数 之 后 。 中 缀 表达 式 
“3 +4” 等 价 于 后 组 表达 式 “3 4 +”; 操作 符 “ +” 是 针对 操作 数 3 和 4 进行 操作 的 。 当 表达 
式 更 加 复杂 时 ， 这 一 思想 同样 也 可 以 用 于 前 组 表达 式 到 后 缀 表达 式 的 转换 当中 。 我 们 只 需 简单 
地 检查 表达 式 并 决定 操作 符 优先 级 即 可 。 
假设 有 中 缀 表达 式 12/(4 +2) ,我们 要 将 其 转换 为 后 级 表达 式 ， 如 下 所 示 : 


表达 式 上 说 明 
12/4 2 + 圆 括号 里 的 4 +2 优先 级 高 ; 用 4 2 + 代替 


两 个 新 的 操作 数 为 分 别 12 和 4 加 2 的 和 ; 我 们 先 放 置 第 一 个 操作 数 ， 紧 接着 放 第 二 
， 然 后 才 是 除法 运算 符 
















1242+/ 个 


因此 ， 后 级 表达 式 12 4 2 + /等 价 于 前 缀 表达 式 12/(4 +2) 。 注 意 这 里 没有 必要 交换 操作 数 
的 位 置 ， 并 且 保 证 加 法 优先 级 的 圆 括 号 也 不 需要 。 4 
人 网 考虑 接 下 来 的 中 级 表达 式 (2+3) -6/3。 我们 要 将 其 转换 为 后 级 表达 式 ， 如 下 所 示 : 











表达 式 说 明 
23+ -6/3 圆 括号 里 的 2 +3 优先 级 高 ; 用 2 3 + 代替 
人 | 除法 运算 符 优先 级 高 ， 故 用 6 3/ 代 替 6/3 
23+63/- 我 们 希望 用 2 +3 的 和 减 去 6 除 以 3 的 商 ， 故 将 减法 运算 符 移 到 最 后 





由 此 可 见 ， 后 级 表达 式 2 3 +6 3/ - 等 价 于 中 绥 表 达 式 (2 +3) -6/3。 < 

所 有 的 算术 表达 式 都 可 以 写成 上 述 任何 一 种 表达 式 的 形式 。 但 与 寄存 器 堆栈 结合 的 后 绥 表 
达 式 是 求解 算术 表达 式 最 有 效 的 方法 。 实 际 上 ， 一 些 电 子 计 算 器 ( 比如 惠普 的 计算 器 ) 就 需要 
使 用 逆 波 兰 式 输入 表达 式 。 通 过 在 这 些 计 算 器 上 的 少量 练习 ， 就 有 可 能 快速 地 对 一 个 包含 多 层 
括号 的 长 表达 式 进行 求 值 ， 而 不 用 对 各 项 进行 分 组 。 

使 用 堆栈 来 对 逆 波 兰 式 求 值 的 方法 很 简单 ， 从 左 到 右 扫 描 表 达 式 ， 将 每 一 个 操作 数 (变量 
或 常量 ) 压 栈 ， 当 遇 到 双 目 操作 符 时 ， 弹 出 栈 顶 的 两 个 操作 数 ， 并 执行 由 该 操作 符 指定 的 运算 ， 
然后 再 将 结果 压 人 栈 顶 。 

考虑 道 波兰 式 10 2 3 +/。 使 用 堆栈 对 其 求 值 且 从 左 到 右 扫 描 ， 我们 首先 将 10 压 
栈 ， 紧 接着 将 2 和 3 压 栈 ， 这 样 就 得 到 如 下 情形 : 


3 | 于 一 一 栈 项 
2 
10 
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接 下 来 ， 当 扫描 到 “ + ”运算 符 时 ， 从 栈 顶 依次 弹出 3 和 2， 实 现 (3 +2) 的 操作 ， 并 把 相 
加 的 结果 5 压 栈 ， 如 下 所 示 : 
5 |] < 一 一 栈 项 
昌 


当 扫 描 到 “/” 运 算 符 时 ， 从 栈 顶 分 别 弹出 5 和 10, 用 5 去 除 10， 将 结果 2 压 人 堆栈 。 
(注意 : 对 不 满足 交换 律 的 运算 ( 比如 减法 和 除法 ) 栈 顶 元 素 通常 作为 第 二 个 操作 数 。) 
假设 有 如 下 的 中 组 表达 式 ; 
(X+Y) x(W-Z)+2 





写成 逆 波 兰 式 ， 如 下 所 示 : 
XY+WZ—- x2+ 
为 了 用 堆栈 对 上 述 表 达 式 进行 求 值 ， 我 们 首先 将 和 Y 压 栈 ， 并 对 它们 进行 相 加 (依次 弹 
出 后 再 相 加 ) ， 并 将 所 得 的 和 (和 + 切 压 栈 。 然 后 ,将 友和 2 压 栈 ， 并 相 减 (也 是 先 从 堆栈 中 依 
次 弹出 )， 将 所 得 的 差 (W-Z) 压 人 堆栈 。 接 下 来 的 乘法 运算 符 实现 (+Y) 和 (WW-2Z) 的 相 乘 
(也 是 先 从 堆栈 中 依次 弹出 )， 从 堆栈 中 删除 这 两 个 表达 式 并 将 它们 的 乘积 压 信 堆栈。 我 们 将 2 
压 人 堆栈 ， 就 会 得 到 如 下 结果 : 





< 一 一 栈 顶 
K+Y)x(W-Z) 











最 后 扫描 到 的 是 加 法 运算 符 ， 首 先 弹出 当前 栈 项 的 两 个 元 素 ， 然 后 对 它们 进行 相 加 ， 将 所 
得 的 和 再 压 栈 ， 最 终 ， 栈 顶 存放 的 就 是 (X+y) x (WW-Z) +2 的 值 。 < 
假设 有 逆 波兰 表达 式 : 
86+42-/ 
将 其 转换 为 中 组 表达 式 。 

记 住 每 一 个 运算 符 都 紧 跟着 它 的 操作 数 。“ + ”运算 符 的 操作 数 为 8 和 6,“ - ”运算 符 的 
操作 数 为 4 和 2。 而 “/” 运 算 符 的 第 一 个 操作 数 是 8 加 上 6 的 和 ， 第 二 个 操作 数 是 4 减 去 2 的 
差 。 在 中 缀 表达 式 中 ,我 们 必须 使 用 圆 括号 (保证 加 法 和 减法 运算 在 乘法 之 前 实现 ) ， 结 果 为 : 

(8+6)/(4 -2) 梧 

为 了 描述 零 操 作 数 、 单 操作 数 、 双 操作 数 和 三 操作 数 的 概念 ， 我 们 写 了 一 段 简单 的 程序 ， 
在 这 个 程序 中 分 别 使 用 每 一 种 格式 来 对 算术 表达 式 进行 求 值 。 

假设 我 们 希望 计算 如 下 表达 式 的 值 : 

Z=(XxY)+(WxU) 

一 般 情况 下 ， 当 允许 有 3 个 操作 数 时 ， 至 少 有 一 个 操作 数 要 放 在 寄存 器 中 ， 并 且 第 一 个 操 

作 数 往往 是 目的 操作 数 。 使 用 三 地 址 指令 时 ,求解 Z 值 的 代码 如 下 : 


Mult RL 交 
Mult 到 2 页 河 
Rdd RZ RL 


当 使 用 双 地 址 指令 时 ， 通常 有 一 个 地 址 会 指明 某 个 寄存 器 ( 双 地 址 指令 通常 不 允许 两 个 操 
作 数 都 存放 在 内 存 中 )。 男 一 个 操作 数 可 以 放 在 寄存 器 中 也 可 以 放 在 内 存单 元 中 。 使 用 双 地 址 


指令 写成 的 代码 如 下 : 
Load RE 
Mult RL 


Load R2, W 


仔细 寡 视 指令 集 架 构 199 





Mult :7 

Add RL, ‘BR2 

Store "A 

值得 注意 的 是 ， 确 定 第 一 个 操作 数 是 源 操作 数 还 是 目的 操作 数 是 非常 重要 的 。 在 上 面 的 指 
令 中 ,我 们 假定 第 一 个 操作 数 是 目的 操作 数 。( 这 往往 会 对 那些 需要 在 Intel 汇编 语言 和 Motoro- 
la 汇编 语言 之 间 切 换 的 程序 员 造 成 混淆 一 一 Intel 汇编 语言 指定 第 一 个 操作 数 为 目的 操作 数 ， 而 
Motorola 汇编 语言 中 第 一 个 操作 数 为 源 操作 数 。) 

使 用 单 地 址 指令 (比如 MARIE 中 ) ， 我 们 必须 假定 将 指令 的 运行 结果 作为 目的 操作 数 隐 式 
地 存放 在 一 个 寄存 器 (通常 是 累加 器 ) 中 。 为 了 计算 2 的 值 ， 就 有 了 如 下 的 代码 : 





Load x 
Mult 六 
Store Temp 
Load Ww 
Mult Uy 
Add Temp 
Store Zz 


注意 当 我 们 减少 每 条 指令 允许 的 操作 数 个 数 时 ， 执 行 指定 代码 的 指令 条 数 就 会 增加 。 在 系 
统 结构 设计 中 这 也 是 典型 的 一 种 空间 /时 间 的 权衡 一 一 指令 短 了 但 程序 长 了 。 

那么 这 个 程序 在 基于 堆栈 的 机 器 上 用 零 地 址 指令 实现 会 是 什么 样 呢 ? 基于 堆栈 的 架构 使 用 
不 带 操作 数 的 指令 ， 如 Adada 、Subt 、Mult 或 者 Divide。 我 们 需要 一 个 堆栈 及 对 堆栈 的 两 种 
操作 ( 即 Pop 和 Push) 。 跟 堆栈 沟通 的 操作 必须 要 有 指定 操作 数 的 地 址 字段 以 便 将 操作 数 压 人 
或 弹出 堆栈 (所 有 其 他 操作 都 是 零 地 址 指令 ) 。Pusp 将 操作 数 压 和 人 栈 顶 ，Pop 将 栈 顶 数据 移出 
并 将 其 移动 到 操作 数 的 位 置 。 这 种 架构 对 于 等 式 的 求 值 产生 的 程序 最 长 。 假 设 算术 运算 使 用 栈 
项 的 两 个 操作 数 ， 弹 出 它们 ， 并 将 运算 结果 压 和 人 堆栈 ， 则 对 应 代码 如 下 : 





Push X 

Push ¥ 

Mult 

Push Ww 

Push U 

Mult 

Add 

Pop Z 本 


指令 长 度 肯 定 会 受 指 令 人 允许 的 操作 码 长 度 和 操作 数 个 数 的 影响 。 若 操作 码 长 度 固定 ， 则 译 
码 更 容易 。 然 而 ， 为 了 提供 向 后 辣 容 和 有 灵活 性 ， 操 pgogpopo 
作 码 的 长 度 通常 都 是 可 变 的 。 变 长 操作 码 同样 会 遇 
到 指令 是 定 长 还 是 变 长 的 问题 。 很 多 设计 者 都 采用 操作 码 地 址 1 地 址 2 地 址 3 
了 扩展 操作 码 这 一 折 中 方案 。 


申 串 靖国 区 肌 训 凌驾 这 志 交 是 间 疾 番 
5. 2.5 扩展 操作 码 Eg 
我 们 已 经 看 到 在 指令 中 操作 数 的 个 数 取 决 于 指 操作 和 地 址 1 


令 的 长 度 ， 因 此 我 们 必须 要 有 足够 多 的 位 数 来 表示 ”图 5-2 16 位 指令 格式 对 应 的 两 种 可 能 格式 
操作 码 和 操作 数 的 地 址 。 然 而 ， 并 不 是 所 有 的 指令 都 需要 同样 多 的 操作 数 。 

在 需要 一 套 丰 富 操作 码 的 需求 和 希望 获得 短 指令 的 愿望 之 间 ， 扩 展 操作 码 给 出 了 一 个 折 中 
方案 。 它 的 思想 是 有 一 些 短 操作 码 ， 但 在 需要 时 也 可 以 提供 更 长 的 操作 码 。 当 操作 码 很 短 时 ， 
剩余 的 大 量 二 进 制 位 可 以 用 来 保存 操作 数 (这 就 意味 着 在 一 条 指令 中 我 们 可 以 有 两 个 或 三 个 操 
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作 数 ) 。 当 不 需要 任何 操作 数 时 (比如 Halt 指令 , 或 者 机 器 使 用 堆栈 时 ) ， 指 令 中 所 有 的 二 进 
制 位 都 可 以 用 来 表示 操作 码 ， 这 一 点 考虑 到 了 很 多 特殊 的 指令 。 在 这 里 ， 更 长 的 操作 码 有 更 少 
的 操作 数 ， 而 更 短 的 操作 码 则 有 更 多 的 操作 数 。 

考虑 某 台 计算 机 的 指令 字 长 为 16 位 ， 有 16 个 寄存 器 。 现 在 我 们 用 一 个 寄存 器 组 取代 简单 
的 累加 器 (就 像 在 MARIE 中 一 样 ) ， 我 们 需要 用 4 位 来 指定 某 一 个 寄存 器 。 当 每 条 指令 有 3 个 
寄存 器 操作 数 时 (假设 数据 在 处 理 之 前 都 要 被 读 和 人 寄存 器 中 ) ， 我 们 可 以 编写 16 条 指令 ,或 者 
使 用 4 位 表示 操作 码 ， 其 余 12 位 表示 内 存 地 址 (比如 MARI， 假 设 其 内 存 容量 为 4K) 。 但 是 ， 
如 果 在 寄存 器 集中 所 有 数据 都 需要 事先 读 人 到 某 一 个 寄存 器 中 ， 则 这 条 指令 仅 使 用 4 位 (假设 


共有 16 个 寄存 器 ) 就 能 够 选择 指定 的 数据 元 素 。 这 两 种 选择 方案 如 图 5-2 所 示 。 

但 是 为 什么 要 限定 操作 码 的 位 数 仅 有 4 位 呢 ? 
如 果 允 许 操作 码 的 长 度 可 变 ， 则 剩余 的 可 变 位 数 可 
以 用 来 表示 操作 数 地 址 。 使 用 扩展 操作 码 ， 我 们 可 
以 允许 操作 码 的 长 度 为 8 位 ， 而 它 需 要 两 个 寄存 器 
操作 数 ; 或 者 操作 码 长 12 位 而 只 操作 一 个 寄存 器 ; 


或 者 操作 码 长 16 位 ， 没 有 操作 数 。 这 些 指令 格式 见 


图 5-3。 


仅 有 的 问题 是 我 们 需要 一 种 方法 来 决定 什么 时 


候 指 令 应 该 有 4 位 、8 位 、12 位 或 16 位 的 操作 码 。 


技巧 就 是 使 用 一 个 “ 转 义 操作 码 ” 来 表示 到 底 使 用 


哪 一 种 格式 。 这 一 思想 可 以 用 下 面 的 例子 来 进行 完美 的 描述 。 

假设 我 们 希望 对 下 列 指令 进行 编码 : 

e 15 条 三 地 址 指令 

e 14 条 双 地 址 指令 

。31 条 单 地 址 指令 

。16 条 零 地 址 指令 

我 们 能 够 用 16 位 来 对 上 述 指令 系统 进行 编码 吗 ? 答案 是 可 以 ， 只 要 我 们 使 用 扩展 操作 码 。 
编码 过 程 如 下 : 


0000 
1110 
1111 
二 1 
和 
4 
EN 
TL 
HL 


pe 


十 了 


我 们 可 以 看 到 在 第 一 组 三 地 址 指令 中 转 义 操 作 码 的 使 用 方式 。 当 前 四 位 是 1111 时 


R1 R2 R3 
| 15 条 三 地 址 指令 

Ri Ra RS 

- 转 义 操作 码 

0000 R1 R2 
| 14 条 双 地 址 指令 

下 有 

1110 - 转 义 操作 码 


1110 0000 R1 
| 31 条 单 地 址 指令 

1 TLV RL 

1111 1111 - 转 义 操作 码 


1111 1111 0000 


| 16 条 零 地 址 指令 
I 


图 5-3 16 位 指令 格式 对 应 的 3 种 可 能 格式 


， 这 就 
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意味 着 当前 指令 不 是 有 3 个 操作 数 ， 而 是 两 个 、 一 个 ,或 者 没有 (这 取决 于 接 下 来 的 4 位 )。 对 
第 二 组 指令 双 地 址 指令 来 说 ， 其 转 义 操作 码 是 11111110( 有 此 操作 码 或 高 于 此 操作 码 的 任意 指 
令 不 可 能 有 多 于 一 个 的 操作 数 )。 对 第 三 组 单 地 址 指令 来 讲 ， 转 义 操作 码 是 111111111111( 有 
此 12 位 的 指令 序列 没有 操作 数 ) 。 a 

尽管 这 种 扩展 操作 码 技术 允许 有 更 多 种 类 的 指令 ， 但 也 使 译 码 变 得 更 加 复杂 。 代 替 原 有 的 
通过 查看 位 组 合 模式 从 而 决定 是 哪 一 条 指令 的 方式 ， 我 们 需要 像 下 面 这 样 来 对 指令 进行 译 码 : 

if( 最 左边 4 位 ! =I1111){ 

执行 相应 的 三 地 址 指令 } 
else if (最 左边 7 位 ! =1111-111) { 
执行 相应 的 双 地 址 指令 } 

else if (最 左边 12 位 ! =1111 1111 1111){ 

执行 相应 的 单 地 址 指令 } 

elset{ 

执行 相应 的 零 地 址 指令 

+ 

在 每 一 个 阶段 ,一 个 备用 码 一 一 转 义 操作 码 一 一 用 来 指出 我 们 应 该 查看 更 多 的 二 进 制 位 。 
这 里 还 有 另外 一 个 硬件 设计 者 需要 面临 折 中 的 例子 : 我 们 用 操作 码 的 空间 来 换取 操作 数 的 
空间 。 

当 使 用 扩展 操作 码 时 我 们 如 何 知道 需要 的 指令 集 是 可 能 实现 的 ? 我 们 必须 首先 决定 是 否 有 
足够 的 二 进 制 位 来 产生 需要 的 位 模式 。 一 旦 确定 这 是 可 能 的 ， 我们 就 可 以 为 指令 集 产生 适当 的 
转 义 操作 码 。 

本 了 回顾 例 5.8 中 给 出 的 指令 集 。 为 了 表明 有 足够 的 位 模式 ， 我 们 需要 计算 每 一 种 指 
邻 格式 需要 的 位 模式 数量 。 

e 前 15 条 指令 占据 了 15 * 2 * 2 *2 =15 *2”=61 440 个 位 模式 。( 每 个 寄存 器 的 地 址 可 

以 是 16 种 不 同 的 位 模式 之 一 。) 

@ 接 下 来 的 14 条 指令 占据 了 14 * 2* *2* =14*28 =3584 个 位 模式 。 

e 再 接 下 来 的 31 条 指令 占据 了 31 * 2” =496 个 位 模式 。 

。 最 后 的 16 条 指令 占据 了 16 个 位 模式 。 

如 果 把 上 述 不 同 的 位 组 合 模式 加 起 来 ， 总 共 得 到 61 440 +3584 + 496 + 16 =65 536。 而 指令 
总 共有 16 位 ， 这 也 就 意味 着 我 们 能 够 产生 2 = 65 536 种 位 组 合 模式 (一 个 精确 的 没有 浪费 的 
匹配 ) 。 a 

是 否 可 以 设计 一 种 扩展 操作 码 来 满足 有 下 述 编码 要 求 的 12 位 指令 ? 假设 操作 数 
存放 在 寄存 器 中 ， 寄 存 器 地 址 需要 3 位 ， 指 令 系 统 不 允许 直接 访问 内 存 地 址 。 

e 三 地 址 指令 4 条; 

e 单 地 址 指令 255 条 ; 

e 零 地 址 指令 16 条 。 

前 4 条 指令 需要 4*2? *2” *2 =2' =2048 种 位 模式 。 接 下 来 的 255 条 指令 需要 255 * 2 = 
2040 种 位 模式 。 最 后 16 条 指令 需要 16 种 位 模式 。 

而 12 位 能 表示 2”=4096 种 位 模式 。 如 果 我 们 将 上 述 3 种 位 模式 加 起 来 ， 将 会 得 到 2048 + 
2040 + 16 =4104。 因 此 我 们 需要 4104 种 位 模式 来 产生 这 个 指令 系统 ,但 是 12 位 指令 最 多 只 能 
产生 4096 种 位 模式 。 因 此 ， 我 们 无 法 设计 出 满足 指定 要 求 的 扩展 操作 码 指令 集 。 a 

最 后 让 我 们 从 头 到 尾 看 一 个 例子 。 

假设 指令 字 长 为 8 位 ， 是 否 可 以 使 用 扩展 操作 码 来 实现 满足 下 列 要 求 的 编码 ? 
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如 果 可 以 ， 给 出 编码 。 

e 3 条 3 位 操作 数 的 双 地 址 指令 ; 

e 2 条 4 位 操作 数 的 单 地 址 指令 ; 

e 4 条 3 位 操作 数 的 单 地 址 指令 。 

首先 ， 我 们 必须 计算 可 能 需要 的 编码 数目 。 

e 3*2’ *2 =3*2°=192 

e 2*2. =32 

e@ 4*2’ =32 

如 果 我 们 将 需要 的 位 模式 数 相 加 ， 则 得 到 192 +32 +32 =256。 当 指令 字 长 8 位 时 ， 一 共有 
2 =256 种 位 模式 ， 因 此 我 们 可 以 精确 地 匹配 每 一 条 指令 (这 意味 着 编码 是 合理 的 ， 但 每 一 种 
位 模式 在 创建 时 都 会 被 使 用 ) 。 

我 们 可 以 使 用 的 编码 如 下 : 

O00 xxx Kxx 


0 ‘sue I 3 条 3 位 操作 数 的 双 地 址 指令 


10 XXX XXX 
11 - 转 义 操作 码 


1100 xxxx 


a 2 条 4 位 操作 数 的 单 地 址 指令 


1110 - 转 义 操作 码 
1111 - 转 义 操作 码 
i1100 S00 
i101 XXX 
11110 30 
111 a 


5.3 指令 类 型 

大 多 数 计算 机 指令 都 是 对 数据 进行 运算 操作 的 ; 但 是 ， 也 有 一 些 指令 不 是 。 计 算 机 制造 商 
通常 将 指令 分 为 以 下 几 类 : 数据 传送 、 算 术 运 算 、 布 尔 运算 、 位 操作 ( 移 位 和 循环 移 位 ) 、 输 
入 /和 输出、 传送 控制 以 及 特殊 用 途 的 指令 。 

下 面 我 们 就 来 讨论 上 述 各 种 指令 类 型 。 


5. 3.1 数据 传送 


数据 传送 指令 是 使 用 最 频繁 的 指令 类 型 。 数 据 从 内 存 传送 到 寄存 器 ， 从 寄存 器 传送 到 寄存 
器 ， 以 及 从 寄存 器 传送 到 内 存 ， 并 且 一 些 计 算 机 根据 源 操作 数 和 目的 操作 数 的 位 置 提供 了 不 同 
的 指令 。 例 如 ， 对 于 两 个 存放 在 寄存 器 中 的 操作 数 传输 来 说 ， 可 以 使 用 MOVER 指令 ， 而 MOVE 
指令 则 人 允许 两 个 操作 数 一 个 在 寄存 器 中 另 一 个 在 内 存 中 。 一 些 指令 集体 系 结构 (比如 RISC ) 为 
了 加 快 指令 的 运行 ， 限 制 了 对 内 存 读 写 数据 。 一 些 计算 机 针对 数据 字 节 的 不 同 大 小 ， 有 多 种 
读 、 写 、 传 送 指令 。 比 如 ， 读 取 字 节 可 以 用 LOADB 指令 ， 而 读 取 字 可 用 LOADW 指令 。 数 据 传 
送 类 指令 包括 MOVE、LOAD、STORE 、PUSH、POP、EXCHANGES 和 它们 的 多 个 变种 。 


5. 3.2 算术 运算 


算术 运算 指令 包括 使 用 整数 和 浮 点 数 执行 运算 的 指令 。 一 些 指令 集 对 不 同 的 数据 大 小 提供 
了 不 同 的 算术 指令 。 当 和 数据 传送 指令 一 起 使 用 时 ， 在 不 同 寻 址 方式 中 ， 有 一 些 不 同 的 指令 用 
来 提供 寄存 器 和 内 存 访 问 的 可 变 组 合 形式 。 算 术 指令 可 以 处 理 带 符号 数 和 无 符号 数 ， 也 可 以 处 


4 条 3 位 操作 数 的 单 地 址 指令 
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理 不 同 进 制 的 操作 数 。 很 多 时 候 ， 操 作 数 是 在 算术 指令 中 隐 含 的 。 比 如 说 ， 乘 法 指令 可 以 假设 
被 乘 数 常 驻 于 某 个 专用 寄存 器 中 ， 故 不 用 在 指令 中 显 式 给 出 。 这 类 指令 也 影响 标志 寄存 器 的 
值 ， 如 设置 零 标 志 位 、 进 位 标志 位 、 滋 出 标志 位 等 ( 仅 举 几 个 例子 ) 。 算 术 运 算 指令 包括 ADD、 
SUBTRACT 、MULTIPLY 、DIVIDE 、INCREMENT 、DECREMENT 和 NEGATE( 改变 符号 位 )。 


5. 3.3 布尔 逻辑 运算 指令 

布尔 逻辑 指令 实现 布尔 运算 ， 很 大 程度 上 它 和 算术 运算 的 工作 方式 一 样 。 这 些 指令 人 允许 二 
进 制 位 的 置 位 、 清 零 和 求 反 。 逻 辑 运算 通常 用 来 控制 输入 /输出 设备 。 像 算术 运算 一 样 ， 逻 辑 
指令 也 影响 标志 寄存 器 的 值 ， 包 括 进 位 标志 位 和 溢出 标志 位 。 典 型 的 逻辑 指令 有 AND 、NOT、 
OR、XOR、TEST 和 COMPARE。 


5. 3.4 位 操作 指令 

位 操作 指令 用 于 在 给 定 的 数据 字 内 对 某 一 位 (有 时 候 是 一 组 二 进 制 位 ) 进 行 置 位 或 复位 。 
这 包括 算术 和 逻辑 移 位 指令 SHIFT 和 循环 移 位 指令 ROTATE ， 每 一 位 可 以 左 移 或 者 右 移 。 逻 辑 
移 位 指令 将 数位 简单 地 向 左 或 者 向 右 移动 指定 的 位 数 ， 在 相反 的 一 端 补 以 相同 位 数 的 0。 比 
如 ， 如 果 我 们 有 一 个 8 位 寄存 器 ， 其 存储 值 为 11110000， 若 执行 逻辑 左 移 1 位 的 话 ， 结 果 就 是 
11100000。 针 对 初 值 11110000， 如 果 右 移 一 位 ， 则 结果 为 01111000。 

算术 移 位 指令 一 般 用 于 执行 乘 以 2 或 者 除 以 2 的 操作 ， 它 将 数据 作为 有 符号 二 进 制 补 码 形 
式 来 看 待 ， 最 左边 一 位 不 移 位 ， 因 为 它 代表 符号 位 。 对 于 算术 右 移 ， 复 制 符号 位 到 其 右边 : 如 
果 数 值 是 正 数 ， 则 最 左边 的 位 用 零 填 充 ; 如 果 数 值 为 负 ， 则 最 左边 一 位 用 1 填充 。 算 术 右 移 等 
价 于 除 以 2。 举 例 说 明 ， 如 果 给 定 值 为 00001110( +14)， 并且 我 们 要 执行 算术 右 移 1 位 的 操 
作 ， 其 结果 是 00000111( +7) 。 如 果 给 定 值 为 负数 ， 比 如 11111110( -2) ， 右 移 1 位 的 结果 就 
是 11111111( -1)。 对 于 算术 左 移 ， 数 位 向 左 移 ， 空 位 补 0， 但 是 符号 位 不 参与 移 位 。 算 术 左 
移 等 价 于 乘 以 2。 比如， 如 果 寄 存 器 的 初 值 为 00000011( +3) ， 则 算术 左 移 1 位 的 结果 就 是 
00000110( + 6)。 如 果 寄 存 器 初 值 为 负数 ， 比 如 11111111( - 1) ， 则 算术 左 移 1 位 得 到 
11111110( -2)。 如 果 移 掉 的 最 后 1 位 (除了 符号 位 ) 跟 符号 位 不 匹配 ， 就 会 发 生 上 溢 或 者 下 
溢 。 比 如 ， 如 果 对 数值 10111111( - 65 ) 进 行 算术 左 移 1 位 的 操作 ， 则 结果 为 11111110( -2)， 
但 此 时 移出 位 是 0， 跟 符号 位 不 同 ， 故 结果 发 生 上 溢 。 

循环 移 位 指令 是 一 个 简单 的 移 位 指令 ， 它 会 把 移出 的 位 从 另 一 个 方向 移 人 一 一 其 根本 就 是 
循环 移 位 。 比 如 ， 循 环 左 移 1 位 ， 最 左边 的 位 被 移出 ， 循 环 移 位 后 它 成 了 最 右边 一 位 。 如 果 要 
移 位 的 值 是 00001111， 循 环 左 移 1 位 就 得 到 00011110。 如 果 00001111 循环 右 移 1 位 ， 则 结果 
就 是 10000111。 循 环 移 位 时 ， 我 们 不 用 担心 符号 位 的 问题 。 

另外 ， 对 于 逻辑 移 位 和 循环 移 位 来 说 ， 有 些 计算 机 的 指令 集 架 构 可 以 对 指定 位 清 零 、 置 位 
和 切换 。 


5. 3.5 输入 /输出 指令 


输入 /输出 指令 在 不 同 的 指令 集 架 构 上 区 别 很 大 。 输 入 (或 读 ) 指 令 将 数据 从 一 台 设 备 或 
端口 传送 到 内 存 或 指定 的 寄存 器 中 。 输 出 (或 写 ) 指令 将 数据 从 内 存 或 寄存 器 中 传送 到 指定 
的 端口 或 设备 。 对 字符 或 者 数值 数据 可 以 设计 单独 的 输入 /输出 指令 。 一 般 来 说 ， 字 符 和 字 
符 串 数据 使 用 某 些 类 型 的 块 输入 /输出 指令 ， 将 输入 自动 变 为 字符 串 形 式 。 处 理 输入 /输出 的 
基本 方案 是 编程 控制 LO、 由 中 断 驱 动 LO 和 DMA 设备。 这些 内 容 将 会 在 第 7 章 中 进行 详 
细 讨 论 。 





5. 3.6 传送 控制 指令 

传送 指令 用 于 改变 程序 执行 的 正常 顺序 。 这 些 指令 包括 分 支 、 跳 转 、 过 程 调用 、 返 回 和 程 
序 终止 。 分 支 可 能 是 无 条 件 的 (比如 跳 转 ) 也 可 能 是 有 条 件 的 ( 比如 条 件 转移 ) 。 跳 转 指令 (可 能 
是 有 条 件 的 或 无 条 件 的 ) 是 基于 分 支 指令 的 ,但 地 址 是 隐 含 的 。 因 为 跳 转 指令 不 需要 操作 数 ， 
所 以 它 经 常 使 用 地 址 字段 的 位 来 指定 不 同情 况 ( MARIE 中 调用 Skipconad 指令 ) 。 一 些 语言 包 
含 循 环 指令 ， 它 可 以 自动 组 合 条 件 和 非 条 件 转 移 。 

过 程 调用 是 专门 的 分 支 指令 ， 它 能 自动 保存 返回 地 址 。 不 同 机 器 保存 地 址 的 方法 不 同 。 一 
些 机 器 将 地 址 保存 在 内 存 的 指定 位 置 ， 另 外 一 些 则 将 地 址 保存 在 寄存 器 中 ， 还 有 一 些 机 器 将 返 
回 地 址 压 入 堆栈 中 。 


5. 3.7 专用 指令 


专用 指令 包括 用 于 字符 串 处 理 、 高 级 语言 支持 、 保 护 、 标 志 控 制 、 字 / 字 节 转换 、 高 速 组 
存 管理 、 寄 存 器 访问 、 地 址 计算 、no-ops 和 其 他 未 纳入 先前 分 类 的 指令 。 大 多 数 指令 集 架 构 为 
字符 串 处 理 提供 了 指令 ， 包 含 字 符 串 处 理 和 搜索 。No-op 指令 虽然 占用 了 时 间 和 空间 ， 却 不 引 
用 任何 数据 ， 基 本 上 什么 也 不 做 。 为 了 延迟 一 段 时 间 插 入 有 用 的 指令 它 经 常用 作 位 置 符号 ,或 
者 用 于 流水 线 中 ( 见 5.5 节 )。 


5. 3.8 正 交 指令 集 


不 管 机 器 的 体系 结构 是 硬 线 方式 还 是 微 程序 方式 ,拥有 一 个 完整 的 指令 集 都 是 非常 重要 
的 。 然 而 ， 由 于 每 一 条 指令 都 需 转换 为 一 个 电路 或 者 一 个 过 程 ， 所 以 设计 者 必须 当心 不 能 加 入 
元 余 指令 。 因 此 ， 每 条 指令 应 该 实现 一 个 唯一 的 功能 ， 并 且 没 有 复制 任何 其 他 指令 。 有 些 人 将 
这 一 特性 称 为 正 交 。 实 际 上 ， 正 交 的 定义 更 严格 。 它 不 仅 要 求 指令 必须 独立 ， 而 且 指 令 集 必须 
也 是 一 致 的 。 比 如 说 ， 正 交涉 及 操作 数 和 寻 址 方式 通过 不 同 运算 的 一 致 的 可 用 程度 。 这 就 意味 
着 操作 数 的 寻 址 方式 必须 独立 于 操作 数 ( 寻 址 方式 将 在 5.4. 2 节 中 讨论 )。 在 正 交 性 的 要 求 之 
下 ， 操 作 数 /操作 码 的 关系 不 能 被 限定 (对 特殊 指令 没有 使 用 专用 寄存 器 ) 。 另 外 ， 对 于 一 个 有 
乘法 命令 而 无 除法 命令 的 指令 集 ， 它 不 会 是 正 交 的 。 因 此 ， 正 交 性 包含 指令 集中 的 独立 性 和 一 
致 性 两 个 问题 。 正 交 指 令 集 使 得 写 一 个 语言 的 编译 器 更 容易 了 。 然 而 ， 典 型 的 正 交 指令 集 有 非 
常 长 的 指令 字 ( 由 于 要 求 具 有 一 致 性 ， 所 以 操作 数字 段 长 ) ， 从 而 转换 的 程序 较 长 并 占用 更 多 
空间 。 


5.4 寻 址 

尽管 寻 址 是 一 个 指令 设计 问题 并 且 也 是 指令 格式 中 的 技术 部 分 ， 但 寻 址 也 包含 很 多 的 主 
题 ， 值 得 我 们 单独 用 一 节 来 介绍 它 。 现 在 我 们 给 出 寻 址 中 最 重要 的 两 个 问题 : 能 寻 址 的 数据 类 
型 和 可 变 的 寻 址 方式 。 我 们 仅仅 涵盖 基本 的 寻 址 方式 ， 更 专业 的 寻 址 方式 可 以 通过 本 节 的 基本 
方式 来 构成 。 


5.4.1 数据 类 型 


在 研究 如 何 寻 址 数据 之 前 ， 我 们 先 简要 地 介绍 一 下 指令 能 够 访问 的 多 种 数据 类 型 。 如 果 指 
令 要 访问 一 个 专门 的 数据 类 型 ， 则 必须 有 硬件 的 支持 。 在 第 2 章 ， 我 们 讨论 了 数据 类 型 ， 包 括 
数值 数据 和 字符 型 数据 。 数 值 数据 包括 整数 和 浮 点 数 。 整 数 可 以 是 符号 也 可 以 是 无 符号 ， 而 且 
可 以 声明 为 多 种 长 度 。 比 如 说 ,在 C++ 语言 中 ,整数 可 以 是 短 整 型 (short，16 位 ) ， 整 型 (int， 


仔细 害 视 指令 集 架 构 205 





已 知 体系 结构 的 字 长 ) ,或 者 长 整 型 (long，32 位 )。 浮 点 数 的 长 度 可 以 是 32 位 、64 位 或 者 128 
位 。 对 ISA 来 说 ， 拥 有 能 处 理 变 长 数值 数据 的 特殊 指令 ， 这 并 不 罕见 ， 就 像 之 前 我 们 看 到 的 一 
样 。 比 如 说 ， 指 令 集中 可 能 分 别 有 针 对 16 位 整数 的 32 位 整数 的 不 同 的 MOVE 指令 。 

非 数值 数据 类 型 包括 字符 串 、 布 尔 类 型 和 指针 。 字 符 串 指令 通常 包括 复制 、 移 动 、 搜 索 或 
者 修改 等 操作 。 布 尔 运算 包括 AND、OR、XOR 和 NOT。 指 针 是 内 存 中 的 真实 地 址 。 尽 管事 实 
上 ， 它 们 是 自然 数 ， 但 会 将 它们 和 整数 及 浮 点 数 区 别 对 待 。MARIE 允许 在 间接 寻 址 模式 中 使 
用 此 数据 类 型 。 在 指令 中 使 用 这 种 方式 的 操作 数 实际 是 指针 。 在 使 用 指针 的 指令 中 ， 操 作 数 本 
质 上 是 一 个 地 址 并 且 也 必须 是 一 个 地 址 。 


5. 4.2 寻 址 方式 


在 第 4 章 讲 到 ,在 MARIE 指令 中 操作 数字 段 的 12 位 能 用 两 种 方式 进行 解释 : 它们 可 以 表 
示 操 作 数 的 内 存 地 址 ， 也 可 以 是 指向 物理 内 存 地 址 的 指针 。 这 12 位 可 以 有 很 多 不 同 的 理解 ， 
这 样 就 给 我 们 提供 了 多 种 寻 址 方式 。 寻 址 方式 允许 我 们 指定 在 指令 中 操作 数 所 处 的 位 置 。 一 种 
寻 址 方式 能 够 指定 一 个 常数 、 一 个 寄存 器 或 内 存 中 的 一 个 位 置 。 某 些 方 式 允 许 使 用 短 地 址 ， 有 
些 寻 址 方式 允许 我 们 决定 实际 操作 数 的 位 置 ， 它 通常 也 称 为 操作 数 的 有 效 地 址 。 现 在 我 们 就 来 
看 一 下 几 种 最 基本 的 寻 址 方式 。 

立即 寻 址 ， 顾 名 思 义 ， 指 操作 数 就 是 指令 中 紧 跟 操作 码 之 后 的 值 ， 而 且 立 即 就 能 被 访问 
到 。 也 就 是 说 ， 操 作 数 是 指令 的 一 部 分 。 比 如 说 ， 如 果 操 作 数 的 寻 址 方式 是 立即 寻 址 ， 且 指令 
是 LOAD 008 ， 那 么 数值 8 就 会 装 和 人 到 AC 中 。 操 作 数 字段 的 12 位 不 指定 地 址 ， 而 是 指定 指令 
需要 的 实际 操作 数 。 立 即 寻 址 速度 快 ， 因 为 要 读 入 的 数值 就 包含 在 指令 中 。 然 而 ， 由 于 在 编译 
时 要 装 入 的 值 是 固定 的 ， 因 此 不 是 很 灵活 。 

直接 寻 址 ， 是 指 在 指令 中 通过 直接 内 存 地 址 给 出 了 操作 数 。 比 如 说 ， 如 果 操 作 数 的 寻 址 方 
式 是 直接 寻 址 并 且 指 令 为 LOAD 008， 那 么 在 内 存 地 址 为 008 的 单元 中 存放 的 数据 就 会 装 人 到 
AC 中 。 虽 然 指令 中 没有 包含 操作 数 本 身 ， 但 直接 寻 址 是 典型 的 快速 寻 址 ， 原 因 就 是 它 可 以 快 
速 访问 到 操作 数 。 直 接 寻 址 也 比 立即 寻 址 灵活 ， 因 为 给 定 地 址 中 的 数值 是 可 以 改变 的 。 

在 寄存 器 寻 址 中 ， 用 来 指定 操作 数 的 内 存 地 址 被 寄存 器 编号 所 取代 。 除 了 用 寄存 器 引用 地 
址 字段 取代 内 存 寻 址 之 外 ， 寄 存 器 寻 址 和 直接 寻 址 是 很 相似 的 。 给 定编 号 的 寄存 器 中 存放 的 是 
操作 数 。 

间接 寻 址 是 一 种 强大 的 寻 址 方式 ， 它 提供 了 非常 高 的 灵活 性 。 在 这 种 寻 址 方式 中 ， 地 址 字 
段 的 位 数 指定 了 一 个 内 存 地 址 ， 而 该 地 址 当 作 一 个 指针 来 使 用 。 通 过 此 内 存 地 址 可 以 找到 操作 
数 的 有 效 地 址 。 比 如 说 ， 操 作 数 的 寻 址 方式 采用 间接 寻 址 并 且 指 令 为 LOAD 008 ,那么 在 内 存 
地 址 为 0x008 的 单元 中 存放 的 数值 实际 上 是 所 请 求 操 作 数 的 有 效 地 址 。 假 设 我 们 发 现在 0x008 
单元 中 存放 的 值 是 0x2A0。 则 0x2A0 是 我 们 请 求 操作 数 的 真正 地 址 。 在 地 址 0x2A0 中 存放 的 数 
值 才 会 装 入 到 AC 中 。 

在 间接 寻 址 的 变种 中 ， 操 作 数 字段 给 出 的 不 是 内 存 地 址 ， 而 且 是 寄存 器 地 址 。 这 种 方式 称 
为 寄存 器 间接 寻 址 ， 除 了 使 用 一 个 寄存 器 来 存放 操作 数 的 地 址 ， 而 不 使 用 内 存单 元 之 外 ， 它 和 
间接 寻 址 的 工作 方式 相同 。 比 如 说 ， 如 果 指 令 为 LoAD R1 ， 并 且 它 使 用 寄存 器 间接 寻 址 方式 ， 
那么 我 们 将 会 在 R1 中 找到 所 请 求 操作 数 的 有 效 地 址 。 

在 变 址 寻 址 方式 中 ， 一 个 变 址 寄存 器 ( 显 式 或 隐 式 设计 ) 用 来 存储 偏 移 量 (或 位 移 量 )， 偏 
移 量 加 上 指令 的 操作 数 ， 就 得 到 了 所 请 求 操作 数 的 有 效 地 址 。 比 如 ， 如 果 要 访问 指令 Load X 
中 的 操作 数 X 使 用 变 址 寻 址 ， 并 且 R1 是 变 址 寄存 器 ， 并 且 存 放 的 值 是 1， 那 么 操作 数 的 有 效 
地 址 就 是 X +1。 基 址 寻 址 也 是 相似 的 ， 只 是 给 定 的 是 基 址 寄存 器 ， 而 非 变 址 寄存 器 。 理 论 上 ， 


206 ”第 5 章 





这 两 种 寻 址 方式 的 区 别 是 如 何 使 用 它们 ， 而 不 是 如 何 计算 出 操作 数 。 一 个 变 址 寄存 器 存储 变 址 
值 ， 这 个 值 通常 用 作 偏 移 量 ， 并 且 跟 指令 中 地 址 码 字段 给 出 的 地 址 有 关 。 一 个 基 址 寄存 器 存放 
一 个 基地 址 ， 而 地 址 码 字 段 表示 相对 于 此 基地 址 的 偏 移 量 。 这 两 种 寻 址 方式 在 对 数组 元 素 和 字 

符 串 中 的 字符 进行 访问 时 ， 是 非常 有 用 的 。 实 际 上 ， 在 字符 串 操 作 中 大 多 数 汇 编 语言 提供 了 隐 
含 的 专用 变 址 寄存 器 。 在 这 种 寻 址 方式 中 ， 也 经 常 使 用 通用 寄存 器 ， 而 这 依赖 于 指令 集 的 
设计 5 

如 果 使 用 堆栈 寻 址 ， 那 么 操作 数 应 假设 存放 在 堆栈 中 。 我 们 在 5. 2.4 节 中 已 经 讲 过 这 
ple 

上 述 寻 址 方式 存在 很 多 变化 形式 。 举 例 说 明 ， 一 些 机 器 设置 了 间接 变 址 寻 址 ， 也 就 是 同时 
使 用 间接 寻 址 和 变 址 寻 址 。 也 有 的 机 器 设计 了 基 址 / 偏 移 寻 址 ， 它 将 一 个 偏 移 量 和 基 址 寄存 器 
中 的 值 进行 相 加 ， 然 后 将 和 加 到 指定 操作 数 上 ， 从 而 产生 实际 指令 中 所 用 操作 数 的 有 效 地 址 。 
还 有 的 用 自动 递增 和 自动 递减 模式 。 这 些 模 式 对 寄存 器 中 
的 值 进行 自动 递增 或 者 自动 递减 ， 从 而 减少 代码 量 ， 这 在 
嵌入 式 系统 中 是 极其 重要 的 。 自 相关 寻 址 是 根据 当前 指令 站 
地 址 的 一 个 偏 移 量 来 计算 操作 数 的 地 址 。 除 此 之 外 ， 还 存 。 0x900 
在 一 些 寻 址 方式 ; 然而 ， 在 理解 你 遇 到 的 任意 寻 址 方式 时 ， 人 
熟悉 立即 寻 址 、 直 接 寻 址 、 寄 存 器 寻 址 、 间 接 寻 址 、 变 址 0x1000 
寻 址 和 堆栈 寻 址 等 会 对 你 大 有 帮助 。 关 

下 面 通过 一 个 例子 来 描述 这 些 变形 的 寻 址 方式 。 假 设 
要 执行 指令 Load 800 ， 内 存 和 寄存 器 R1 中 的 内 容 如 图 5- 0x1600 
4 所 示 。 操 作 数字 段 为 0x800， 对 其 应 用 这 些 变形 的 寻 址 方 


0x800 


0x1100 





图 5-4 ” 当 执 行 指令 Load 800 时 ， 


式 ， 并 且 假 设 Rl 在 变 址 寻 址 中 是 隐 含 的 ， 实 际 加 载 到 AC 丙 海 定 的 贞 容 
中 的 值 见 表 5-1。 指 令 Load R1 使 用 寄存 器 寻 址 方式 ， 将 
0x800 读 和 到 累加 器 ， 并 且 使 用 寄存 器 间接 寻 址 将 0x900 读 和 到 累加 器 。 

我 们 在 表 5-2 中 总 结 了 这 些 寻 址 方式 。 


表 5-1 使 用 图 5-4 所 示 的 变形 寻 址 方式 时 内 存 中 的 结果 
和 T py 








操作 数 在 指令 中 





立即 寻 址 



































直接 寻 址 ”| ”在 地 址 码 字段 中 有 操作 数 的 有 效 地 址 

寄存 器 寻 址 操作 数 的 值 存储 在 寄存 器 中 

间接 寻 址 地 址 码 字段 指向 实际 操作 数 的 地 址 

寄存 器 间接 寻 址 寄存 器 存储 实际 操作 数 的 地 址 

变 址 寻 址 或 基 址 寻 址 地 址 码 地 段 的 内 容 加 上 寄存 器 中 的 内 容 得 到 操作 数 的 有 效 地 址 
堆 术 寻 址 操作 数 在 堆栈 中 


对 特定 操作 数 计算 机 如 何 知道 究竟 使 用 哪 种 寻 址 方式 呢 ? 我 们 已 经 看 到 了 一 种 解决 问题 的 
方法 。 在 MARIE 系统 中 ， 有 两 种 Jump 指令 。 也 有 两 种 加 法 指令 一 一 ADD 
和 ADDI。 指 令 本 身 包含 了 计算 机 用 于 确定 适当 寻 址 方式 的 信息 。 一 些 语言 对 同一 条 指令 有 多 
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个 版 本 ， 每 一 种 版 本 表示 一 种 不 同 的 寻 址 方式 和 不 同 的 数据 大 小 。 

如 果 只 有 少量 的 寻 址 方式 ， 那 么 在 操作 码 中 编码 寻 址 方式 就 可 以 了 。 但 是 ， 如 果 有 很 多 种 
寻 址 方式 ,那么 最 好 就 要 使 用 一 个 单独 的 地 址 说 明 符 ， 地 址 说 明 符 是 指令 中 的 一 个 字段 ， 用 这 
个 字段 中 的 位 表示 指令 中 的 操作 数 应 采用 哪 种 寻 址 方式 。 

多 种 寻 址 方式 比 局 限于 一 种 或 两 种 寻 址 方式 允许 我 们 指定 更 大 更 多 的 位 置 范围 。 当 然 ， 这 
也 是 一 种 折 中 的 方案 。 我 们 为 提高 灵活 性 和 增 大 地 址 范围 ， 牺 牲 了 地 址 计算 和 有 限 内 存 引 用 的 
简单 性 。 


5.5 指令 流水 线 

到 现在 为 止 ， 你 应 该 很 熟悉 第 4 章 中 讲 过 的 取 指 - 译 码 - 执行 周期 了 。 理 论 上 ， 计 算 机 时 
钟 的 每 一 个 脉冲 都 被 用 来 控制 序列 中 的 一 步 操作 ， 但 有 时 用 额外 的 脉冲 来 控制 某 步 操作 中 的 微 
小 细节 。 有 些 CPU 将 上 述 取 指 - 译 码 - 执行 周期 划分 成 更 小 的 步骤 ， 而 这 些小 步骤 能 通过 并 
行 来 实现 。 这 种 重 倒 加快 了 指令 的 执行 。 这 种 当前 所 有 CPU 都 采用 的 方法 ， 就 是 众所周知 的 
流水 线 技术 。 指 令 流 水 线 是 一 种 用 来 实现 指令 级 并 行 (ILP ) 的 方法 。[ 其 他 方法 包括 超标 量 和 
超 长 指令 字 (VLIW ) 。] 我 们 将 指令 流水 线 放 在 本 章 来 介绍 ， 因 为 一 台 机 器 的 JSA 影响 着 指令 流 
水 线 到 底 有 多 成 功 。 

假设 取 指 - 译 码 - 执行 周期 能 够 分 解 为 以 下 的 “小 步 又 ”: 

e 取 指 令 

e 译 码 

e 计算 操作 数 的 有 效 地 址 

。 取 操 作 数 

。 执行 指令 

e 保存 结果 

指令 流水 线 和 工厂 的 自动 装配 线 很 相似 。 在 计算 机 流水 线 中 每 一 步 完 成 指令 的 一 部 分 。 就 
好 像 自 动 装配 线 ， 不 同步 又 并 行 完 成 不 同 指令 的 不 同 部 分 。 每 一 个 步骤 叫 作 一 个 流水 线 阶 段 。 
这 些 阶 段 连接 起 来 形成 一 条 流水 线 。 指 令 从 一 端 进 入 ， 贯 穿 多 个 阶段 ， 最 后 从 流水 线 的 另 一 端 
出 去 。 目 标 是 均衡 经 过 每 一 个 流水 线 阶段 的 时 间 ( 也 就 是 说 ， 它 基本 上 和 其 他 流水 线 阶段 花费 
的 时 间 是 相同 的 ) 。 如 果 这 些 阶 段 在 时 间 上 没有 达到 均衡 ， 则 不 久之 后 ， 快 的 阶段 就 会 等 待 慢 
的 阶段 。 来 看 一 个 现实 生活 中 的 这 种 不 均衡 ， 考 虑 洗衣 服 的 各 个 阶段 。 如 果 只 有 一 台 洗 衣 机 和 
一 台 烘 干 机 ， 你 会 经 常 等 待 烘 干 机 。 如 果 你 把 洗衣 作为 第 一 个 阶段 ， 而 把 干 衣 作 为 下 一 个 阶 
段 ， 你 就 能 看 到 花费 时 间 更 长 的 干 衣 阶段 会 导致 衣服 在 两 个 阶段 之 间 堆 成 了 山 。 如 果 将 至 衣服 
作为 第 三 个 阶段 ， 你 很 快 就 会 意识 到 这 个 阶段 会 持续 等 待 其 他 速度 慢 的 阶段 。 

图 5-5 所 示 为 采用 重 释 技术 的 计算 机 流水 线 示意 图 。 我 们 能 看 到 每 一 个 时 钟 周期 和 每 一 条 
各 令 的 每 一 个 阶段 (S1 表示 取 指 、S2 表示 译 码 、S3 表示 计算 、S4 表示 取 操 作 数 、S5 是 执行 、 
而 S6 是 保存 结果 。) 

从 图 5-5 可 以 看 出 ,一 旦 指令 1 被 取出 并 进入 译 码 阶段 ， 我 们 就 可 以 开始 取 指 令 2。 当 指 
令 1 取 操 作 数 时 ， 且 指令 2 被 译 码 时 ， 我 们 可 以 开始 取 指 令 3。 注 意 这 些 操作 都 能 并 行进 行 ， 
这 种 工作 方式 和 工厂 里 的 自动 装配 线 非常 相似 。 

假设 有 一 条 上 阶段 流水 线 ， 时 钟 周期 为 + ， 也 就 是 说 ,每 个 流水 阶段 花费 时 间 为 +,。 接 着 
假设 有 条 指令 (通常 也 称 为 任务 ) 要 处 理 。 完 成 任务 1( 7 ) 的 时 间 为 kxt,。 余 下 的 n-1 个 任 
务 依次 从 接 下 来 的 每 一 个 时 钟 周期 中 涌 出 ， 这 也 就 意味 着 执行 这 些 任务 所 花费 的 总 时 间 为 (n - 
1) xt,。 因 此 ,使 用 自流 水 线 完 成 n 个 任务 需要 的 时 间 为 : 





(Ext ) (n=1)s = (kn=1) 
或 者 是 k+(n 一 1) 个 时 钟 周期 。 


时 钟 “时钟 时 钟 ”时钟 时 钟 时 钟 时 钟 ”时钟 ”时钟 
周期 1 周期 2 周期 3 周期 4 周期 5 周期 6 周期 7 周期 8 周期 9 
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指令 1 


lls ll le 
指令 2 
le] sl lol 
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图 5-5 贯穿 流水 线 6 个 阶段 的 4 条 指令 


我 们 来 计算 一 下 使 用 流水 线 之 后 产生 的 加 速 比 。 不 用 流水 线 时 ， 需 要 花费 mi, 个 时 钟 周 期 ， 
其 中 六 =%kxt,。 因 此 ， 加 速 比 (用 使 用 了 流水 线 的 时 间 去 除 以 未 采用 流水 线 的 时 间 ) 就 是 : 

nt, 
(En=1, 
如 果 n 趋 于 无 穷 ， 那么 (+n 1) 就 接近 于 n， 这 就 形成 了 理论 上 的 加 速 比 : 


Speedup $ = 


xi, 


k 
Speedup S$ = ee k 
p 


理论 加 速 比 大 就 是 流水 线 的 段 数 。 

接 下 来 ， 我 们 看 一 道 例题 。 

假设 有 一 个 4 阶段 流水 线 ， 其 中 : 

e Sl = 取 指 

。S2 = 译 码 并 计算 有 效 地 址 

。S3 = 取 操作 数 

。S4 = 执行 指令 并 保存 结果 

我 们 必须 假设 计算 机 的 体系 结构 提供 了 一 种 可 以 并 行 取 数据 和 指令 的 方法 。 这 可 以 通过 独 
立 的 指令 和 数据 通路 来 完成 ， 然 而 ， 大 多 数 的 存储 系统 都 不 允许 这 么 做 。 作 为 代替 方式 ， 它 们 
在 高 速 缓冲 存储 器 中 提供 了 操作 数 ， 在 大 多 数 情况 下 ， 它 允许 指令 和 操作 数 被 同时 取出 。 假 设 
指令 B 是 条 件 转 移 语 句 ， 能 够 改变 执行 顺序 ( 因此 ， 接 下 来 不 是 运行 人 H， 而 是 转 去 控制 指令 
I8) 。 这 导致 了 流水 线 的 运行 如 图 5-6 所 示 。 

注意 四 、I65 和 16 被 取出 并 且 按 照 通过 每 一 个 阶段 ， 但 是 在 13( 分 支 指令 ) 执 行 之 后 ，14、 
15 和 16 就 不 再 需要 了 。 仅 仅 在 6 个 时 间 段 之 后 ， 当 执行 分 支 指令 时 ， 可 以 取 指 将 要 执行 的 指 
令 18， 从 这 之 后 ,流水 线 就 又 被 占 满 了 。 从 时 间 段 6 ~9,， 仅 有 1 条 指令 被 执行 。 理 想 的 状况 
是 ， 在 流水 线 被 填 满 后 的 每 一 个 时 间 段 ， 都 应 该 有 1 条 指令 从 流水 线 流出 。 但 是 ,我们 通过 上 
述 例子 可 以 看 出 并 不 是 一 定 会 如 此 。 < 
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图 5-6 带 有 条 件 转移 的 指令 流水 线 示例 


请 注意 并 不 是 所 有 的 指令 都 需要 通过 流水 线 的 每 一 个 阶段 。 如 果 一 条 指令 没有 操作 数 ， 那 
么 就 没有 必要 进入 阶段 3。 为 了 简化 流水 线 的 硬件 和 时 序 ， 规定 所 有 的 指令 都 通过 所 有 的 阶 
段 ， 而 不 管 是 否 需要 进入 某 个 阶段 。 

从 我 们 之 前 讨论 的 加 速 比 来 看 ， 可 能 会 出 现 如 下 情况 : 如 果 流 水 线 包 含 更 多 的 阶段 ， 那 么 
每 一 个 段 的 时 间 都 可 以 更 短 。 这 是 对 的 。 在 将 数据 从 存储 器 传送 到 寄存 器 时 ， 负 载 是 固定 的 。 
流水 线 控制 逻辑 的 数量 会 随 着 功能 段 的 增长 而 按 比 例 增长 ， 从 而 减缓 整个 执行 时 间 。 另 外 ， 下 
面 几 种 情况 会 引起 “流水 线 冲突 ”， 这 也 阻碍 了 每 个 时 钟 周期 产 出 一 条 指令 的 目标 。 这 包括 : 

。 资源 冲突 

® 数据 依赖 

。 条 件 转移 语句 

资源 冲突 (也 叫 结构 冒险 ) 在 指令 级 并 行 中 是 主要 关注 的 一 个 问题 。 举 例 说 明 ， 如 果 一 条 
站 令 正 在 将 某 值 存储 到 内 存 中 ， 而 男 一 条 指令 正在 从 内 存 中 取 指 令 ， 那么 这 两 条 指令 都 需要 访 
问 内 存 。 通 常 的 解决 方法 是 允许 正在 执行 的 指令 继续 执行 ， 而 强迫 取 指 指令 等 待 。 这 种 冲突 也 
可 以 通过 提供 两 条 独立 的 数据 通路 来 解决 : 一 条 用 于 从 内 存 中 读 取 数 据 ， 而 另 一 条 用 于 从 内 存 
中 读 出 指令 。 

数据 依赖 发 生 在 当 一 条 指令 执行 的 结果 还 没 产 生 时 ， 就 将 其 作为 下 一 条 指令 的 操作 数 来 
使 用 。 

比如 说 ， 考 虑 两 个 顺序 执行 的 语句 X=Y+3 和 2Z=2*X。 这 个 问题 发 生 在 第 四 个 时 间 段 。 
第 二 条 指令 需要 取 操 作 数 X， 但 是 第 一 条 指令 直到 指令 执行 结束 才能 保存 结果 ， 因 此 X 在 时 间 
段 4 的 起 始 位 置 是 不 可 访问 的 。 











有 几 种 方法 可 以 处 理 这 些 类 型 的 流水 线 冲突 。 可 以 增加 专用 硬件 来 检测 指令 ,这些 指令 的 
源 操作 数 是 由 流水 线 上 距离 这 些 指令 较 远 的 指令 产生 的 。 这 个 硬件 能 够 在 流水 线 中 插入 一 个 简 
单 的 延迟 (通常 是 一 条 什么 也 不 做 的 no-op 指令 ) ， 人 允许 有 足够 的 时 间 来 解决 冲突 。 专 用 硬件 也 
可 以 用 来 检测 这 些 冲 突 并 沿 着 存在 于 流水 线 不 同 阶 段 之 间 的 专门 通路 传递 数据 。 对 于 需要 访问 
操作 数 的 指令 来 说 ， 这 种 方法 减少 了 需要 的 时 间 。 一 些 体系 结构 解决 这 个 问题 的 方法 是 让 编译 
带 解 决 这 种 冲突 。 编 译 右 已 经 被 设计 用 来 重新 排序 指令 ， 从 而 推迟 了 加 载 冲 突 数据 的 时 间 ， 但 
是 这 对 程序 逻辑 或 输出 没有 影响 。 

分 支 指令 让 我 们 能 够 交换 程序 中 的 执行 流 ， 就 流水 线 而 言 ， 它 会 引起 一 些 主要 问题 。 如 果 
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每 一 个 时 钟 周期 取 一 条 指令 ,那么 在 后 续 指令 到 来 之 前 会 有 好 几 条 指令 被 取出 甚至 被 译 码 。 这 
意味 着 分 支 被 执行 了 。 条 件 分 支 尤其 难以 处 理 。 很 多 的 体系 结构 都 提供 了 分 支 预测 功能 ， 使 用 
逻辑 电路 来 预测 接 下 来 需要 执行 哪 条 指令 ( 本质 上 ， 它们 是 预测 条 件 分 支 的 结果 )。 编 译 器 尝 
试 通过 重新 安排 机 器 代码 引起 延迟 转移 来 解决 分 支 问题 。 一 种 尝试 是 重新 排序 并 插 人 有 用 的 指 
令 ,， 但 如 果 这 是 不 可 能 的 ， 就 搬入 no-op 指令 占 满 流水 线 。 一 些 机 器 为 条 件 分 支 使 用 的 其 他 方 
法 是 在 每 一 个 分 支 的 两 个 路 径 上 都 取 指令 并 保存 这 些 指令 ， 直 到 分 支 被 实际 执行 ， 此 时 将 会 知 
道 “ 真 正 ” 的 执行 路 径 。 

为 了 从 芯片 中 挤 出 更 多 的 性 能 ， 现 代 CPU 采用 了 超标 量 设计 (第 4 章 中 介绍 的 ) ， 超 标量 
比 流 水 线 前 进 了 一 步 。 超 标量 芯片 有 多 个 ALU， 在 每 一 个 时 钟 周期 访问 多 条 指令 。 而 每 条 指令 
的 时 钟 周 期 实际 上 可 以 低 于 一 个 周期 。 但 是 跟踪 冒险 的 逻辑 更 加 复杂 ， 需 要 更 多 的 逻辑 来 调度 
操作 而 不 是 执行 操作 。 即 使 有 复杂 的 逻辑 ， 也 很 难 动态 地 调度 并 行 操作 。 

动态 调度 的 局 限 性 使 得 计算 机 器 设计 者 想到 了 一 种 非常 不 同 的 架构 ， 显 式 并 行 指令 计算 机 
(EPIC) ， 第 4 章 讨论 的 Ianium 架构 就 是 其 最 好 的 例证 。EPIC 计算 机 有 庞大 的 指令 (Itanium 的 
指令 是 128 位 ) ， 可 以 指定 并 行 实现 的 几 个 操作 。 在 这 种 设计 中 由 于 固有 的 并 行 性 ， 因 此 EPIC 
指令 集 严 重 依赖 于 编译 器 ( 这 意味 着 用 户 需要 一 个 复杂 的 编译 器 来 利用 并 行 性 ， 从 而 得 到 显著 
的 性 能 优势 ) 。 调 度 操 作 的 负担 从 处 理 器 转移 到 了 编译 器 上 ， 从 而 可 以 花 更 多 的 时 间 来 开发 一 
个 好 的 调度 并 分 析 潜 在 的 流水 线 冲突 。 

为 了 减少 由 条 件 分 支 引 起 的 流水 线 问 题 ，IA-64 引信 了 推测 指令 。 比 较 指令 集 推测 各 个 位 ， 
就 像 是 在 x86 机 器 上 设置 的 条 件 码 (除了 这 里 是 64 个 推测 位 外 ) 。 每 一 个 操作 指定 一 个 推测 位 ， 
仅 当 推测 位 等 于 1 时 ， 才 会 执行 操作 。 实 际 上 ， 所 有 的 指令 都 被 执行 了 ， 但 是 只 有 推测 位 等 于 
1 时 ， 结 果 才 会 存放 到 寄存 器 文件 里 。 结 果 就 是 执行 更 多 的 指令 ， 但 是 我 们 不 用 让 流水 线 停 下 
来 等 待 一 个 条 件 。 

并 行 性 有 几 个 层次 ， 从 简单 到 复杂 。 所 有 的 计算 机 都 在 某 种 程度 上 采用 了 并 行 性 。 指 令 使 
用 字 作 为 操作 数 ( 字 的 长 度 通 常 是 16 位 、32 位 、64 位 ) ， 而 不 是 每 次 对 一 位 进行 操作 。 更 高 级 
的 并 行 需要 更 专业 和 更 复杂 的 人 硬件 以 及 操作 系统 的 支持 。 

尽管 对 并 行 的 深入 讨论 超过 了 本 书 的 范围 ， 但 在 这 里 我 们 也 对 并 行 的 两 个 极端 情况 进行 一 
个 简单 回顾 : 程序 级 并 行 (PLP) 和 指令 级 并 行 (ILP)。PLP 实际 上 允许 程序 的 一 部 分 运行 在 多 
台 计 算 机 上 。 这 听 上 去 很 简单 ， 但 是 它 需 要 对 算法 进行 准确 编码 以 使 并 行 成 为 可 能 ， 并 要 提供 
不 同 模块 间 的 同步 。 

ILP 包含 了 允许 重合 指令 执行 的 技术 。 本 质 上 ， 我们 想 让 单个 程序 中 的 多 条 指令 并 发 地 执 
行 。 有 两 种 类 型 的 ILP。 第 一 种 类 型 的 ILP 将 一 条 指令 分 解 为 不 同 的 阶段 并 将 这 些 阶段 重 释 执 
行 。 这 正 是 流水 线 所 做 的 。 第 二 种 类 型 的 ILP 允许 单个 指令 重生 执行 (也 就 是 说 ,指令 可 以 在 
同一 时 刻 由 处 理 器 本 身 来 执行 ) 。 

除了 流水 线 架构 之 外 ， 超 标量 、 超 流水 线 和 超 长 指令 字 ( VLIW ) 架构 都 呈现 了 ILP 的 特征 。 
超标 量 架构 (如 第 4 章 所 讲 ) 通 过 使 用 并 行 流水 线 在 同一 时 刻 实现 了 多 个 运算 操作 。 实 际 使 用 超 
标量 架构 的 机 器 有 IBM 的 PowerPC，Sun 公司 的 UltraSparc 和 DEC 的 Alpha。 超 流水 线 架 构 通 过 
将 流水 线 阶段 细 分 成 更 小 的 片段 ， 从 而 使 超标 量 的 概念 和 流水 线 结合 在 了 一 起 。IA-64 展示 了 
一 种 VLIW 架构 ， 这 意味 着 每 一 条 指令 能 够 指定 多 个 标量 运算 (编译 器 将 多 个 运算 放 进 一 条 单 
指令 中 ) 。 超 标量 和 VLIW 机 器 在 每 一 个 周期 取出 并 执行 多 于 一 条 的 指令 。 


5.6 指令 集 架 构 实例 
我 们 看 一 下 第 4 章 中 讨论 过 的 两 种 架构 Intel 和 MIPS。 进 而 看 一 下 这 些 处 理 器 的 设计 者 是 如 
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何 选择 以 处 理 本 章 我 们 介绍 的 这 些 问 题 的 : 指令 格式 、 指 令 类 型 、 操 作 数 的 个 数 、 寻 址 方式 和 流 
水 线 。 我 们 也 会 介绍 Java 虚拟 机 来 描述 软件 如 何 产生 ISA 抽象 从 而 完全 隐藏 机 器 真实 的 SA。 最 
后 ， 我 们 介绍 ARM 架构 ， 它 是 一 种 你 可 能 没有 听 说 过 但 现在 使 用 很 广泛 的 架构 。 


5.6.1 Intel 


Intel 使 用 小 端 存 储 ， 双 地 址 结构 和 变 长 指令 格式 。Intel 处 理 器 使 用 寄存 器 - 存储 器 型 结 
构 ， 这 就 使 所 有 的 指令 都 能 够 在 存储 器 上 进行 操作 ， 但 其 他 操作 数 必须 得 存放 在 寄存 器 中 。 这 
种 ISA 允许 对 变 长 数据 进行 运算 ， 包 括 1、2 或 4 字 节 的 数据 。 

从 8086 到 80486 都 是 单 阶段 流水 线 结构 。 设 计 人 员 认 为 如 果 一 条 流水 线 产生 的 效果 好 ， 
那么 两 条 会 更 好 。Pentium 系列 有 两 条 平行 的 5 阶段 流水 线 ， 分别 为 U 指令 流水 线 和 V 指令 流 
水 线 。 上 述 流水 线 的 阶段 中 包括 预 取 指令 、 指 令 译 码 、 地 址 生成 、 执 行 和 写 回 。 为 了 更 有 效 ， 
这 些 流 水 线 必须 保持 满 状 态 ， 这 就 需要 能 够 并 行 处 理 指令 。 保 证 这 种 并 行 性 的 能 够 发 生 则 是 编 
译 器 的 任务 。Pentium 开 将 流水 线 的 阶段 数 提高 到 了 12， 它 包含 预 取 指令 、 指 令 长 度 译 码 、 指 
令 译 码 、 重 命名 /资源 定位 、UOP 调度 /分 派 、 执 行 、 写 回 和 退出 。 增 加 的 大 多 数 新 阶段 用 来 参 
与 Intel 的 MMX 技术 ， 这 一 技术 是 对 架构 的 一 种 扩展 ， 用 来 处 理 多 媒体 数据 。Pentium 亚 将 阶段 
数 又 提高 到 了 14，PentiumJV 更 是 到 了 24。 增 加 的 功能 段 ( 本章 中 没有 介绍 过 的 ) 包 括 用 来 决定 
指令 的 长 度 、 产 生 微 运算 和 “保证 ”指令 (确保 指令 执行 并 且 结 果 是 永久 性 的 )。Ttanium 仅 包 
含 10 阶段 的 指令 流水 线 : 指令 指针 生成 、 取 指 、 循 环 、 扩 展 、 重 命名 、 字 - 线 译 码 、 寄 存 器 
读 、 执 行 、 异 常 检测 和 写 回 。 

Intel 处 理 器 允许 使 用 本 章 讲 过 的 基本 的 寻 址 方式 ， 此 外 它 还 包含 很 多 其 他 组 合 形式 。8086 
提供 了 17 种 不 同 的 访问 内 存 的 方法 ， 它 们 中 大 多 都 是 这 些 基 本 寻 址 方式 的 变种 。Intel 中 更 流 
行 的 Pentium 架构 包含 与 以 前 产品 一 样 的 寻 址 方式 ， 但 也 引入 了 新 的 寻 址 方式 ， 这 更 多 是 为 了 
维持 向 后 兼容 。IA-64 出 人 意外 地 缺少 了 存储 器 寻 址 方式 。 它 仅 有 一 种 访问 存储 器 的 方式 : 寄 
存 器 间接 寻 址 ( 算 后 增 量 是 可 选 的 ) 。 这 看 上 去 不 同 往常 的 限制 ， 但 却 遵循 了 RISC 思想 。 地 址 
在 通用 寄存 器 中 计算 和 存储 。 更 复杂 的 寻 址 方式 需要 专用 硬件 ; 通过 限制 寻 址 方式 的 种 类 ， 
IA-64 架构 减少 了 对 这 种 专用 人 硬件 的 需求 。 


5,6.2 "MIPS 


MIPS 架构 (最 开始 是 没有 互 锁 流水 线 阶段 的 微 处 理 器 的 缩写 ) ， 它 采用 小 端 存储 方式 、 按 
字 寻 址 、 三 地 址 结构 和 定 长 SA。 它 是 一 个 取 - 存 架构 ， 即 只 有 装载 和 存储 指令 才能 够 访问 存 
储 器 。 所 有 其 他 的 指令 必须 使 用 寄存 器 来 存储 操作 数 ， 这 就 意味 着 这 一 指令 集 架 构 需 要 大 量 的 
寄存 器 集合 。MIPS 也 受 定 长 运算 操作 的 限制 (对 有 相同 字 节 数 的 数据 进行 运算 ) 。 

有 些 MIPS 处 理 器 ( 比如 R2000 和 R3000) 有 5 段 流水 线 ( 取 指 、 指 令 译 码 、 执 行 、 存 储 器 访 
问 和 写 回 ) 。R4000 和 R5000 有 8 段 超 流水 线 ( 取 指 前 半 段 、 取 指 后 半 段 、 寄 存 器 读 取 、 执 行 、 
取 数 据 前 半 段 、 取 数据 后 半 段 、 标 签 检 查 和 写 回 ) 。R10000 非常 有 意思 ， 因 为 它 在 流水 线 内 的 
段 数 取决 于 指令 经 过 的 功能 单元 : 整数 指令 有 5 个 阶段 ，load/store 指令 有 6 个 阶段 ， 而 浮 点 指 
令 有 7 个 阶段 。MIPS 5000 和 10 000 都 设计 超标 量 。 

MIPS 有 一 个 明确 的 指令 集 ， 这 个 指令 集 包含 5 种 基本 的 指令 类 型 : 简单 的 算术 指令 (add、 
XOR、NAND 、shift) ， 数 据 传 送 指令 (load 、store 、move ) ， 控 制 指令 (branch、jump) ， 多 周期 
指令 (multiply 、divide) 和 其 他 指令 (保存 PCC， 保存 条 件 寄存 器 ) 。MIPS 程序 员 可 以 使 用 立即 寻 
址 、 寄 存 器 寻 址 、 直 接 寻 址 、 寄 存 器 间接 寻 址 、 基 址 寻 址 和 变 址 寻 址 等 方式 。 然 而 ，ISA 本 身 
仅 提 供 一 种 寻 址 方式 ( 基 址 寻 址 ) 。 其 余 的 寻 址 方式 是 由 编译 器 提供 的 。MIPS64 增加 了 两 种 寻 
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址 方式 用 于 艇 入 式 系统 的 优化 。 

第 4 章 中 介绍 的 MIPS 指令 包含 4 个 字段 : 一 个 操作 码 字 段 ， 两 个 操作 数 地 址 ， 一 个 结果 
地 址 。 本 质 上 它 有 3 种 指令 格式 可 用 : 工 类 型 (立即 数 ) 、R 类 型 (寄存 器 ) 和 J 类 型 ( 跳 转 ) 。 

R 类 型 指令 有 6 位 操作 码 、5 位 源 寄 存 器 、 第 二 个 5 位 源 寄 存 器 、5 位 目的 寄存 器 、5 位 移 
位 位 数 和 6 位 功能 位 。I 类 型 指令 有 6 位 操作 数 、5 位 源 寄存 器 、5 位 目的 寄存 器 或 分 支 条 件 和 
16 位 立即 数 分 支 偏 移 量 或 者 地 址 偏 移 量 。J 类 型 指令 有 6 位 操作 码 和 26 位 目的 地 址 。 

MIPS 的 指令 集 架构 和 Intel 的 架构 不 同 ， 部 分 在 于 它们 的 设计 理念 不 同 。Intel 为 8086 设计 
指令 集 架 构 之 时 ， 内 存 还 是 非常 昂贵 的 ， 这 就 意味 着 设计 一 个 指令 集 时 需要 尽量 地 压缩 编码 。 
这 也 是 Intel 使 用 变 长 指令 的 主要 原因 。8086 使 用 的 小 寄存 器 集合 不 允许 有 非常 多 的 数据 保存 
在 寄存 器 中 ， 因 此 才 有 双 地 址 指令 (与 此 相对 应 的 是 MIPS 中 的 三 地 址 指令 )。 当 Intel 发 展 到 
IA32 指令 集 架构 时 ， 大 多 数 用 户 需 要 考虑 向 后 兼容 的 需求 。 


5. 6.3 Java 虚拟 机 


Java 是 一 种 日 益 流行 的 语言 ， 在 平台 独立 性 方面 是 非常 令 人 感 兴趣 的 。 这 意味 着 如 果 你 想 
在 一 种 架构 上 编译 代码 ( 比如 Pentium) 并 且 希 望 在 男 一 种 架构 上 运行 它 (比如 Sun 工作 站 ) ， 你 
可 以 不 用 修改 甚至 不 用 重新 编译 代码 。 

当 第 一 次 编译 你 的 代码 时 ，jJava 编译 器 不 会 做 任何 关于 程序 运行 在 哪个 架构 的 假设 ， 比 如 
说 寄存 器 的 数目 、 内 存 大 小 或 者 ZKO 端口 。 然 而 编译 之 后 ， 要 执行 程序 时 ， 你 将 需要 一 个 对 应 
程序 运行 架构 的 Java 虚拟 机 (JVM)。( 虚 拟 机 是 真实 机 器 的 软件 仿真 ,)JVM 本 质 上 是 一 个 
“封装 ”， 它 在 硬件 架构 上 运行 而 且 是 非常 依赖 于 平台 的 。Pentium 的 JVM 不 同 于 Sun 工作 站 的 
JVM， 后 者 不 同 于 Macintosh 的 JVM， 依 次 类 推 。 但 是 一 旦 JVM 存在 于 一 个 专用 架构 上 ，JVM 
就 能 够 执行 在 任意 指令 集 平台 上 编译 的 Java 程序 。 在 运行 时 ， 加 载 、 检 查 、 查 找 和 执行 字 节 码 
都 是 JVM 的 任务 。 尽 管 JVM 是 虚拟 的 ， 但 它 也 是 一 个 设计 良好 的 ISA 的 完美 示例 。 

一 个 专用 架构 的 JVM 是 用 此 架构 的 初始 指令 集 写成 的 。 它 扮演 着 解释 器 的 角色 ， 获 取 Java 
的 字 节 码 并 将 它们 解释 成 为 显 式 的 底层 机 器 指令 。 字 节 码 是 在 编译 Java 程序 时 产生 的 。 接 下 来 
这 些 字 节 码 就 会 成 为 JVM 的 输入 。JVM 可 以 比 作 一 个 巨大 的 switch( 或 者 case) 语 句 , 一 次 
分 析 一 条 字 节 码 指令 。 每 一 条 字 节 码 指令 会 引起 一 个 到 具体 代码 模块 的 跳 转 ， 这 个 模块 可 以 实 
现 给 定 的 字 节 码 指令 。 

这 和 你 熟悉 的 高 级 语言 有 显著 的 不 同 。 比 如 ， 当 你 编译 一 个 C ++ 程序 时 ,产生 的 目标 代 
码 是 针对 特定 架构 的 。( 编译 一 个 C ++ 程序 会 产生 一 个 汇编 语言 程序 ， 然 后 再 将 其 翻译 为 机 器 
码 。) 如 果 你 想 让 你 的 C ++ 程序 在 不 同 的 平台 上 运行 ， 你 就 必须 在 目标 架构 上 重新 编译 它 。 编 
译 器 编译 的 语言 翻译 成 可 执行 文件 的 二 进 制 机 器 码 。 一 旦 产生 了 二 进 制 码 ， 它 就 只 能 运行 在 目 
标 架 构 上 了 。 编 译 型 语言 通常 都 呈现 出 良好 的 性 能 并 且 会 对 操作 系统 提供 友好 的 访问 。 编 译 型 
语言 包括 C、C ++ 、Ada、FORTRAN 和 COBOL。 

某 些 语言 (比如 LISP、PhP、Perl、Python 、Tcl 和 大 多 的 Basic 语言 ) 是 解释 型 语言 。 每 次 程 
序 运行 时 ， 源 代码 都 必须 重新 解释 一 次 。 解 释 型 语言 为 平台 独立 性 付出 的 代价 是 具有 了 更 慢 的 
性 能 一 一 经 常 是 慢 100 倍 。( 我 们 将 在 第 8 章 中 更 多 的 讨论 这 个 话题 ) 

那 种 两 者 兼 而 有 之 (编译 型 语言 和 解释 型 语言 ) 的 语言 也 有 。 它 们 经 常 被 称 为 P- code 语 
言 。 用 这 些 语言 编写 的 源 代码 会 被 编译 成 一 种 叫 作 P- code 的 中 间 形 式 ， 接 下 来 P- code 就 会 被 
解释 。P-code 语言 通常 比 编译 型 语言 慢 5 ~ 10 倍 。Python 、Perl 和 Java 事实 上 是 P- code 语言 ， 
尽管 通常 认为 它们 是 解释 型 语言 。 

图 5-7 给 出 了 Java 语言 编程 环境 的 一 个 概述 。 
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程序 源 文件 
(file. java) 


(file. class) 


实际 字 节 码 





图 5-7 Java 编程 环境 


也 许 比 Java 的 平台 独立 性 更 有 趣 (尤其 是 跟 本 章 内 容 相 关 的 ) 是 Java 字 节 码 是 基于 堆栈 语 
言 的 这 一 事实 ， 其 部 分 指令 是 由 零 地 址 指令 组 成 的 。 每 一 条 指令 包含 一 个 字 节 的 操作 码 ， 紧 接 
着 是 零 或 多 个 操作 数 。 操 作 码 本 身 表示 了 其 后 边 是 否 有 操作 数 和 操作 数 的 形式 (如 果 有 操作 
数 ) 。 这 些 指令 当中 的 很 多 都 不 需要 操作 数 。 

Java 使 用 2 的 补 码 来 表示 有 符号 整数 ， 同 时 不 允许 使 用 无 符号 整数 。 字 符 是 用 16 位 Uni- 
code 编码 的 。Java 有 4 个 寄存 器 ， 它 们 对 5 个 不 同 主 存储 器 区 域 进行 访问 。 所 有 对 存储 器 的 引 
用 都 是 基于 寄存 器 中 存储 的 偏 移 量 的 ; 它 从 不 使 用 指针 或 绝对 存储 器 地 址 。 由 于 JVM 是 堆栈 
型 机 器 所 以 没有 通用 寄存 器 。 缺 少 通用 寄存 器 对 性 能 是 不 利 的 ， 因 为 这 会 产生 更 多 的 存储 器 引 
用 。 我 们 用 性 能 换 来 了 可 移植 性 。 

接 下 来 我 们 看 一 个 短 的 Java 程序 和 它 相 应 的 字 节 码 。 例 5. 13 给 出 了 一 个 查找 两 数 之 中 最 
大 值 的 Java 程序 。 


这 是 一 个 求 两 数 中 最 大 值 的 Java 程序 。 
public class Maximum { 


public static void main (String[] Args) 
int 

X = Integer.parselInt (Args [0] ) ; 

Y = Integer.parseInt (Args [1] ) ; 

2 = Max(X,Y); 

System.out .println (2); 


} 


public etatic int Max (int A, int B) 
t Tht, CG 
if (A>B)C=A; 
else C= B; 
return C; 
} 
} 


然后 编译 这 个 程序 (用 javac)， 我 们 可 以 将 它 反 汇 编 来 检查 一 下 字 节 码 ， 使 用 如 下 的 命 
令 即 可 : 


javap -c Maximum 





你 将 看 到 以 下 内 容 : 


Compiled from Maximum.java 

public class Maximum extends java.lang.Object { 
public Maximum(); 
public static void main(java.lang.Stzring[] ) ; 
Bublie static int Max(int, int)y 


} 


Method Maximum() 
0 aload 0 
1 invokespecial #1 <Method java.lang.Object()> 
4 return 
Method void main(java.lang.String[] ) 
0 aload 0 
1 iconst. 0 
2 aaload 
3 invokestatic #2 <Method int parseInt (java.lang.String)> 
6 istore 1 
7 aload 0 
8 iconst 1 
9 aaload 
10 invokestatic #2 <Method int parseInt (java.lang.Sstring)> 
13 istore 2 
14 iload 1 
15 iload 2 
16 invokestatic #3 <Method int Max(int, int)> 
19 istore 3 
20 getstatic #4 <Field java.io.PrintStream out> 
23 iload 3 
24 invokevirtual #5 <Method void println(int)> 
27 EEC 


Method int Max(int, int) 
0 iload 0 
1 dload 1 
2 FE icmple 10 
5 iload 0 
6 istore 2 
7 goto 12 
10 iload 1 
11 istoOre 2 
12 iload 2 
13 ireturn 


每 一 行 数值 代表 一 个 偏 移 量 ( 或 从 当前 方法 开始 ， 一 条 指令 所 占 的 字 节 数 )。 注 意 


2 = Max (XrY); 


得 到 编译 成 如 下 的 字 节 码 : 


14 iload 1 

15 116ad. 2 

16 invokestatic #3 <Method int Max(int, int)> 

19 istore 3 二 


Java 字 节 码 是 基于 堆栈 的 ， 这 应 该 很 明显 了 。 比 如 ，iada 指令 从 堆栈 中 弹出 两 个 整数 ， 
它们 相 加 ， 然 后 将 结果 压 人 栈 顶 。 这 里 没有 类 似 “adqa r0，r1，f2” 或 者 “add AC,， xX” 的 
指令 。iloada_1( 整 数 加 载 ) 指 令 同 样 通过 压 人 slot 1 到 栈 顶 (slot 1 中 存放 X， 因 此 X 被 压 人 堆 
栈 ) 来 完成 操作 的 。Y 是 由 指令 15 来 压 人 堆栈 的 。invokestatic 指令 实际 上 实现 Max 方法 
的 调用 。 当 此 方法 执行 完毕 后 ，istore_3 指令 将 栈 顶 元 素 弹 出 并 存放 在 Z 中 。 

我 们 将 在 第 8 章 中 对 Java 语言 和 JVM 进行 更 深入 的 探讨 。 
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5.6.4 ARM 


在 今天 众多 的 便携 设备 中 ARM 是 类 RISC( 精简 指令 集 计 算 机 ) 处 理 器 内 核 的 一 个 家 族 。 实 
际 上 ， 它 是 一 种 使 用 最 为 广泛 的 32 位 指令 集 架构 。 超 过 95% 的 智能 电话 、80% 的 数码 相机 和 
大 于 40% 的 全 数字 电视 中 都 在 使 用 它 。ARM( Advanced RISC Machine ) 最初 是 由 苹果 、Acorn 公 
司 和 VLSI 建立 的 ， 它 成 立 于 1990 年 ， 现 在 是 由 英国 的 ARM Holdings 公司 发 放 授 权 。ARM 
Holdings 公司 不 生产 处 理 器 ， 它 出 售 授权 ， 处 理 器 内 核 是 由 从 ARM 公司 取得 架构 授权 的 各 个 
公司 独立 研发 的 。 这 就 使 得 研发 人 员 可 以 从 最 切合 他 们 需求 的 角度 来 任意 扩展 芯 

ARM 种 类 有 很 多 ， 包 括 ARML 、ARM2 ， 直 到 ARM11， 而 ARM7 、ARM9 、ARMI10 已 成 为 
当前 获取 授权 的 最 主要 家 族 。ARM 处 理 器 有 3 种 架构 系列 : Cortex- A( 在 第 三 方 应 用 为 全 操作 
系统 设计 的 ) ，Cortex-R( 为 艇 人 式 和 实时 应 用 程序 设计 的 ) ， 以 及 Cortex- M (为 微 控制 句 设 计 
的 ) 。ARM 处 理 器 的 实现 多 种 多 样 。 比 如 ， 大 多 数 处 理 器 采用 标准 的 冯 “' 诺 依 曼 架 构 ， 比 如 
ARM7 ， 还 有 一 些 使 用 哈佛 架构 ， 比 如 ARM9。 尽 管 最 新 的 ARM 架构 支持 64 位 计算 ， 但 我 们 
接 下 来 的 讨论 还 是 针对 最 常见 的 32 位 处 理 器 展开 的 。 

”ARM 是 一 种 装载 /存储 架构 ， 故 所 有 的 数据 处 理 都 必须 通过 寄存 器 中 的 值 来 处 理 ， 而 不 是 
存储 器 。 它 采用 长 三 操作 数 指令 和 简单 的 寻 址 方式 ， 尽 管 它 的 变 址 ( 基 址 加 上 偏 移 量 ) 寻 址 方 
式 非常 强大 。 这 些 特征 再 辅 以 16 个 32 位 通用 寄存 器 中 的 大 寄存 器 文件 ， 使 得 流水 线 很 容易 实 
现 。 所 有 的 ARM 处 理 器 都 至 少 有 一 个 3 阶段 流水 线 (包括 取 指 、 译 码 和 执行 ); 更 新 的 处 理 器 
则 有 更 深 的 流水 线 ( 更 多 的 阶段 ) 。 比 如 ， 常 用 的 ARM9 通常 有 一 个 5 阶段 流水 线 ( 和 MIPS 类 
似 ) ; ARMS8 的 某 些 实现 有 一 个 13 阶段 的 流水 线 ( 其 中 取 指 分 解 为 2 个 阶段 ， 译 码 分 解 为 5 个 
阶段 ， 执 行 分 解 为 6 个 阶段 ) 。 

实际 上 ， 在 ARM 架构 中 有 37 个 寄存 器 。 然 而 ， 由 于 它们 是 在 不 同 处 理 器 模式 间 共 享 的 ， 
所 以 当 处 理 器 处 于 某 一 特定 模式 时 ， 仅 有 部 分 是 可 见 的 (可 以 使 用 的 ) 。 处 理 器 模式 对 其 能 够 
实现 的 运算 类 型 和 能 访问 的 数据 范围 设置 规则 和 限制 。 处 理 器 的 运行 模式 从 根本 上 决定 了 它 的 
运算 环境 。 使 用 特权 模式 可 以 直接 访问 硬件 和 存储 器 ， 对 非特 权 模 式 限制 了 能 访问 的 寄存 器 和 
能 使 用 的 其 他 硬件 。ARM 处 理 器 支持 很 多 种 处 理 器 模式 ， 这 取决 于 架构 的 版 本 。 这 些 模式 通 
常 包 含 : (1) 管 理 模式 ， 一 种 对 操作 系统 的 保护 模式 ; (2)FIQ 模式 ， 一 种 支持 高 速 数据 传输 的 
特权 模式 ， 用 来 处 理 高 优先 级 中 断 ; (3) IRQ 模式 ， 一 种 用 来 处 理 通用 中 断 的 特权 模式 ; 
(4) Abort， 一 种 用 于 处 理 存储 器 访问 越界 的 特权 模式 ; (5) Undefined， 当 遇 到 未 定义 或 非法 指 
令 使 用 的 特权 模式 ; (6) System， 运 行 在 特权 操作 系统 任务 上 的 特权 模式 ; (7) User， 一 种 非特 
权 模 式 和 大 多 数 应 用 程序 中 运行 的 模式 。 

与 不 同 模式 有 关 的 几 种 限制 决定 了 如 何 使 用 寄存 器 。 寄 存 器 0 ~7 在 所 有 的 处 理 器 模式 中 
都 是 一 样 的 。 但 是 ， 某 些 寄存 器 的 多 种 副本 称 作 banks， 而 实际 使 用 的 副本 是 由 当前 模式 决定 
的 。 比 如 ， 寄 存 器 13 和 14 在 大 多 数 特权 模式 中 是 banked 寄存 器 ; 这 表示 每 一 种 模式 都 有 各 自 
的 寄存 器 13 和 寄存 器 14 副本 。 这 些 寄存 器 再 加 上 寄存 器 15 ， 都 有 双重 用 途 ; 当 寄存 器 13 、14 
和 15 能 够 被 直接 访问 时 ， 在 相应 的 模式 中 ， 寄 存 吉 13 用 作 堆 栈 指 针 ， 寄 存 器 14 作为 链接 寄 
存 器 ， 而 15 作为 程序 计数 器 。 

所 有 的 ARM 处 理 吉 都 执行 位 逻辑 和 比较 运算 ， 也 能 够 执行 加 法 、 减 法 和 乘法 运算 ; 仅 有 
一 部 分 能 够 实现 除法 。ARM 处 理 器 提供 标准 的 数据 传送 指令 ， 包 括 从 存储 器 到 寄存 器 ， 寄 存 
器 到 存储 器 ， 以 及 寄存 器 到 寄存 器 的 传送 数据 指令 。 除 了 平常 的 单 寄 存 器 传送 ，ARM 也 提供 
多 寄存 器 传送 指令 。ARM 能 同时 对 16 个 通用 寄存 器 的 任意 子 集 和 连续 存储 器 地 址 之 间 进 行 读 
或 写 。 控 制 流 指令 包括 条 件 转移 、 非 条 件 转移 和 过 程 调用 (使 用 分 支 和 链接 指令 来 实现 ， 并 在 
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寄存 器 14 中 保存 返回 地 址 ) 。 

如 果 没 有 流水 线 冲突 以 及 必须 要 访问 的 指令 ， 大 多 数 ARM 指令 可 以 在 单 周 期 内 执行 完毕 。 
为 了 最 小 化 时 钟 周期 的 数目 ，ARM 采用 了 多 种 技术 。 比 如 ， 当 遇 到 分 支 语句 时 ， 通 常 都 是 有 
条 件 地 执行 分 支 。ARM 也 提供 自动 变 址 寻 址 方式 ， 当 执行 装载 /存储 指令 时 ， 它 允许 变 址 寄存 
器 中 的 值 发 生 改 变 。 另 外 ，ARM 有 几 种 专用 指令 和 寄存 器 。 例 如 ， 如 果 指 令 指 定 寄存 器 15 作 
为 目的 寄存 器 ， 则 ALU 的 运算 结果 就 会 被 自动 地 作为 下 一 条 指令 的 地 址 。 如 果 PC 用 在 存储 器 
访问 指令 中 ， 则 下 一 条 指令 就 会 自动 从 存储 器 中 取出 。 

下 面 是 一 个 ARM 的 程序 ， 它 实现 在 寄存 器 1 中 保存 两 个 整数 当中 的 最 大 值 。 比 较 指令 
(cmp ) 实 现 寄存 器 2 减 去 寄存 器 1 的 操作 ， 但 是 它 不 保存 结果 ， 而 是 使 用 差 值 来 在 状态 寄存 器 
中 设置 标志 位 ， 接 下 来 分 支 指令 就 会 用 到 此 标志 位 。 分 支 语句 (bge) 仅 当 寄 存 器 2 中 的 值 大 于 
或 等 于 寄存 器 1 中 的 值 时 才 进 行 跳 转 。 注 意 ， 这 里 的 汇编 语言 和 MARIE ，Intel 和 MIPS( 参加 第 
4 章 ) 是 如 何 相 似 的 。 


ldr rl,Numl ; load the first number into register 1 
ldr r2,Num2 ; load the second number into register 2 


cmp bet BB ; Compare the two numbers 
bge end ; if xl has the larger value we are finished 
mov rl, r2 ; if not, r2 has the larger value so copy it 


; into register 1 
end 
Numl dcd &13579246 
Num2 dcd &13578246 
end 


大 多 数 ARM 架构 可 实现 两 种 不 同 的 指令 集 : 常见 的 32 位 ARM 指令 集 和 16 位 的 Thumb 指 
令 集 。 支 持 Thumb 指令 集 的 芯片 在 名 字 中 都 带 有 字母 T。 [一些 内 核 安 装 有 Java 加 速 器 (Ja- 
zelle) ， 这 使 得 它们 可 以 执行 Java 字 节 码 。 这 些 处 理 器 在 CPU 名 字 上 都 带 有 字母 了 J]。 尽 管 ARM 
中 的 一 些 指令 能 够 在 单 周期 中 执行 ,但 这 些 短 指令 会 使 程序 变 长 ， 因 此 就 需要 更 大 的 内 存 。 当 
速度 不 是 关键 因素 时 ， 相 对 于 处 理 器 的 执行 速度 ， 内 存 的 成 本 就 变 得 很 重要 了 。 对 很 多 ARM 
芯片 来 说 ，Thumb 是 一 个 可 选项 ， 它 可 以 压缩 代码 密度 进而 减少 所 占用 的 存储 空间 。 我 们 应 该 
注意 到 ，ARM 处 理 器 事实 上 仅 包 含 一 个 指令 集 。 当 处 理 器 运行 在 Thumb 模式 下 时 ， 处 理 器 ( 通 
过 芯片 上 的 专用 硬件 ) 将 一 条 Thumb 指令 扩展 成 一 条 等 价 的 ARM 32 位 指令 。 在 Thumb 模式 中 ， 
不 再 包含 16 个 可 访问 的 通用 寄存 器 ， 这 个 数量 缩减 到 8 个 (除了 PC， 栈 指针 和 链接 指针 寄存 
器 之 外 ) 。 

Thumb 指令 集 至 少 有 两 个 变种 : Thumb( 包 含 16 位 定 长 指令 ) 和 Thumb-2( 在 最 新 的 处 理 器 
核 中 出 现 的 ) ， 它 向 后 兼容 Thumb ， 但 是 允许 使 用 32 位 指令 。 虽然 Thumb 是 一 种 压缩 的 浓缩 式 
语言 ( 它 比 ARM 指令 集 所 占 空间 缩小 了 40% ) ， 并 人 允许 更 短 的 操作 码 和 更 优 的 代码 密度 ， 但 是 
其 性 能 却 和 ARM 指令 集 不 匹配 。Thumb-2 的 性 能 比 Thumb 提升 了 25% ， 而 且 也 能 提供 良好 的 
代码 密度 和 能 效 。 

ARM 很 小 ， 因 此 需要 的 晶体 管 很 少 ， 这 也 相应 地 意味 着 它 需 要 很 小 的 功率 。 这 使 得 它 有 
一 个 良好 的 性 能 - 功率 比 ， 因 此 可 以 用 作 便 携 设 备 的 处 理 器 。 当 前 ，ARM 处 理 器 用 在 了 智能 
电话 、 数 码 相 机 、GPS 设备 、 健 身 器 材 、 图 书 阅读 器 、MP3 播放 器 、 智 能 玩具 、 家 电 、 自 动 售 
货机 、 打 印 机 、 游 戏 控制 台 、 平 板 电脑 、 无 线 局 域 网 的 盒子 、USB 控制 器 、 蓝 牙 控制 器 、 医 用 
扫描 仪 、 路 由 器 和 汽车 等 很 多 设备 上 。 虽 然 其 他 一 些 公司 也 设计 了 正在 用 于 便携 设备 上 的 移动 
处 理 器 (最 著名 的 就 是 Intel 的 Atom x86 处 理 器 ) ， 但 是 我 们 预测 ARM 还 将 会 在 相当 长 的 一 段 时 
间 内 统治 移动 设备 的 市 场 。 


本 章 小 结 
指令 集 架 构 的 核心 内 容 包括 存储 器 模型 ( 字 大 小 以 及 地 址 空间 的 分 割 ) 、 寄 存 器 、 数 据 类 型 、 指 
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令 格式 、 寻 址 方式 以 及 指令 类 型 。 尽 管 现 在 的 大 多 数 计算 机 都 有 通用 寄存 器 集合 ， 并 且 通 过 存储 器 
和 寄存 器 位 置 的 组 合 来 指定 操作 数 ， 但 指令 在 大 小 、 类 型 、 格 式 和 操作 数 的 个 数 上 都 有 变化 。 指 令 
也 对 操作 数 的 位 置 也 有 着 严格 的 限制 。 操 作 数 可 以 存放 在 堆栈 、 寄 存 器 、 存 储 器 或 者 上 述 3 种 位 置 
的 组 合 中 。 

在 设计 ISA 时 需要 做 很 多 决策 。 大 的 指令 集 往往 要 求 有 更 长 的 指令 ， 这 也 表示 会 有 更 长 的 取 指 和 译 
码 时 间 。 定 长 指令 译 码 容易 但 是 浪费 存储 空间 。 扩 展 操 作 码 是 对 大 指令 集 的 需求 和 短 指 令 的 渴望 之 间 的 
一 个 折 中 方案 。 也 许 最 有 趣 的 争论 就 是 大 端 和 小 端 字 节 顺序 了 。 

CPU 内 部 的 存储 方式 有 3 种 选择 : 堆栈 、 累 加 器 或 通用 寄存 器 。 每 一 种 都 有 优 缺 点 ， 这 必须 根据 已 
有 架构 的 应 用 环境 来 做 决定 。 内 部 存储 方案 对 指令 格式 有 着 直接 的 影响 ， 尤 其 是 对 指令 允许 引用 的 操作 
数 数目 有 影响 。 堆 栈 架构 使 用 零 操 作 数 ， 这 非常 适合 RPN 表达 式 

指令 可 以 分 为 如 下 几 类 : 数据 传送 、 算 术 运 算 、 布 尔 运算 、 位 运算 、LLO 、 控 制 传输 以 及 专用 指令 。 
有 些 ISA 在 每 一 类 指令 中 都 包含 很 多 指令 ， 而 有 些 ISA 则 包含 很 少 的 指令 ， 还 有 些 ISA 将 各 类 指令 进行 
了 混合 。 正 交 指 令 集 是 一 致 的 ， 在 操作 数 /操作 码 之 间 的 关系 上 没有 限制 。 

存储 技术 上 的 进步 带 来 了 更 大 的 存储 器 ， 也 导致 了 其 他 寻 址 方式 的 出 现 。 变 化 多 样 的 寻 址 方式 包括 
立即 寻 址 、 直 接 寻 址 、 间 接 寻 址 、 寄 存 器 寻 址 、 变 址 寻 址 和 堆栈 寻 址 。 在 不 用 改变 CPU 基本 操作 的 前 提 
下 ， 这 些 不 同 的 寻 址 方式 对 程序 员 提 供 了 很 大 的 灵活 性 和 便利 性 。 

指令 级 流水 线 是 指令 级 并 行 的 一 个 例子 。 流 水 线 是 一 个 普通 但 复杂 的 技术 ， 它 能 够 加 速 取 指 - 译 
码 -执行 周期 的 速度 。 通 过 流水 线 ， 我 们 可 以 重症 指令 的 执行 过 程 ， 从 而 可 以 并 行 地 执行 多 条 指令 。 然 
而 ， 我 们 也 经 常 看 到 并 行 数 量 受到 流水 线 冲 突 的 限制 。 不 同 于 流水 线 同 时 执行 多 条 指令 的 不 同 阶段 ， 超 
标量 架构 允许 我 们 同时 执行 多 种 操作 。 除 了 VLIW 外 ， 结 合 了 超标 量 和 流水 线 技 术 的 超 流水 线 技术 也 简 
要 介绍 了 一 下 。 有 很 多 类 型 的 并 行 ， 但 是 在 计算 机 组 织 和 结构 级 ， 我 们 实际 上 主要 关注 ILP。 

Intel 和 MIPS 的 ISA 都 很 有 意思 ， 这 在 本 章 和 第 4 章 我 们 都 讲 过 。 但 是 ，Java 虚拟 机 是 一 种 特殊 的 
ISA， 因 为 ISA 是 内 置 到 软件 中 的 ， 从 而 Java 程序 在 任何 支持 JVM 的 计算 机 上 都 能 够 运行 。 第 8 章 会 对 
JVM 进行 大 量 详尽 的 介绍 。ARM 是 一 种 支持 多 ISA 的 架构 。 


扩展 阅读 

指令 集 、 寻 址 方式 和 指令 格式 的 内 容 在 几乎 每 一 本 计算 机 体系 结构 的 书 中 都 有 详细 的 介绍 。 
Patterson 和 Hennessy( 2009 ) 的 书籍 、Stallings(2013 ) 和 Tanenbaum(2013 ) 的 书籍 都 对 这 些 内 容 进 行 了 非常 
好 的 描述 。 如 Brey(2003 ) ，Messmer(2001 ) ，Abel(2001 ) 和 Jones(2001 ) 等 编写 的 书籍 都 是 基于 Intel x86 
架构 的 。 对 Motorola 68000 系列 感 兴 趣 的 读者 ， 我 们 建议 你 读 Wray、Greenfield 和 Bannatyne( 1999 ) 或 者 
Miller( 1992 ) 编写 的 书 。 

Sohi( 1990 ) 编写 的 书 对 指令 级 流水 线 给 出 了 一 个 完美 的 讲解 。Kaeli 和 Emma(1991 ) 编写 的 书 对 分 支 
如 何 影响 流水 线性 能 给 出 了 一 个 有 趣 的 总 结 。 如 果 要 了 解 流水 线 的 历史 ， 可 以 看 Rau 和 Fisher( 1993 ) 编 
写 的 书 。 要 想 对 流水 线 的 问题 和 局 限 性 有 更 多 的 了 解 ， 请 看 Wall(1993 ) 编写 的 书 。 

我 们 研究 探讨 了 第 4 章 中 的 几 种 专门 架构 ， 但 是 还 有 很 多 重要 的 指令 集 架 构 值 得 我 们 关注 。 比 如 ， 
Atanasoff 的 ABC 计算 机 (Burks 和 Burks(1988 ) ) ，Von Neumann 的 EDVAC，Mauchly 和 Eckert 的 UNIVAC 
(Stern(1981 ) 对 两 者 都 进行 了 介绍 ) 都 有 非常 简单 的 指令 集 架构 ， 但 是 需要 用 机 器 语言 编程 来 实现 。Intel 
8080( 一 种 单 地 址 计算 机 ) 是 第 4 章 中 介绍 的 80x86 系列 机 的 先驱 。Brey(2003 ) 编写 的 书 对 Intel 系列 机 的 
处 理 器 有 详尽 易 懂 的 介绍 。Hauck 和 Dent( 1968 ) 编写 的 书 给 出 了 关于 Burroughs 零 地 址 计算 机 的 全 面 讲 
解 。Struble( 1984 ) 编写 的 书 很 好 地 描述 了 IBM 360 系列 机 。Brunner(1991) 则 详细 介绍 了 DEC 的 VAX 系 
统 ， 这 个 系统 将 双 地 址 架构 和 更 复杂 的 指令 集结 合 到 了 一 起 。SPARC(1994 ) 对 SPARC 架构 提供 了 一 个 全 
面 的 总 结 。Meyer 和 Downing(1991 ) 、Lindholm 和 Yellin( 1999 ) ， 以 及 Venners( 2000 ) 编写 的 书 都 对 JVM 
给 出 了 非常 有 趣 的 讲解 。 

如 果 想 看 从 32 位 到 64 位 的 有 意思 的 发 展 史 ， 可 以 看 Mashey(2009 ) 编写 的 书 。 作 者 给 出 了 架构 决策 
如 何 产生 非 预期 并 持久 的 后 果 。 
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复习 题 


1. 解释 寄存 器 - 寄存 并、 寄存 器 - 存储器、 存储器 -存储 器 指令 的 区 别 。 
2. 关于 指令 集 存在 着 不 同 的 设计 方案 。 请 给 出 4 种 并 解释 之 。 
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3. 什么 是 扩展 操作 码 ? 

4. 如 果 某 台 计 算 机 采用 字 节 寻 址 ， 字 长 为 32 位 ， 某 内 存单 元 存放 的 十 六 进 制 数 为 98765432， 说 明 这 个 
值 在 小 端 机 器 和 大 端 机 器 上 分 别 是 如 何 被 存储 的 。 为 什么 字 节 顺序 很 重要 ? 

5. 我 们 可 以 设计 堆栈 、 累 加 器 和 通用 寄存 器 型 架构 。 解 释 这 3 种 方案 之 间 的 区 别 ， 并 给 出 一 种 方案 会 优 
于 其 他 方案 的 情况 。 

. 存储 器 - 存储器、 寄存 器 - 存储 器 和 load-store3 种 架构 有 何不 同 ? 它们 的 相同 之 处 是 什么 ? 

. 定 长 和 变 长 指令 的 优 缺点 是 什么 ? 哪 种 是 当今 最 常用 的 ? 

. 基于 零 操 作 数 的 指令 架构 如 何 从 内 存 中 读 取 数据 ? 

. 用 零 地 址 指令 架构 编写 的 程序 、 用 单 地 址 指令 架构 编写 的 程序 和 基于 双 地 址 架构 编写 的 程序 ， 它 们 哪 
个 更 长 (有 更 多 的 指令 )? 为 什么 ? 

10. 为 什么 堆栈 结构 可 以 用 逆 波 兰 式 来 表示 算术 表达 式 ? 

11. 说 出 数据 指令 的 7 种 类 型 并 逐一 解释 。 

12. 算术 移 位 和 逻辑 移 位 的 区 别 是 什么 ? 

13. 解释 指令 集 正 交 意 味 着 什么 。 

14. 什么 是 寻 址 方式 ? 

15. 举例 说 明 立 即 寻 址 、 直 接 寻 址 、 寄 存 器 寻 址 、 间 接 寻 址 、 寄 存 器 间接 寻 址 和 变 址 寻 址 。 

16. 如 何 区 别 变 址 寻 址 和 基 址 寻 址 ? 

17. 为 什么 我 们 需要 那么 多 种 不 同 的 寻 址 方式 ? 

18. 解释 指令 流水 线 背 后 的 概念 。 

19. 对 于 一 个 时 钟 周期 为 20ns 的 4 阶段 流水 线 来 说 ， 如 果 人 处理 100 个 任务 ， 它 的 理论 加 速 比 是 多 大 ? 

20. 在 流水 线 中 ， 引 起 速度 变 缓 的 流水 线 冲 突 是 什么 ? 

21. ILP 的 两 种 类 型 是 什么 ? 如 何 区 分 它们 ? 

22. 解释 超标 量 、 超 流水 线 和 VLIW 体系 结构 。 

23. 列 出 几 种 方法 ， 在 这 些 方法 中 Intel 和 MIPS ISA 是 不 同 的。 再 列 出 几 种 方法 ,在 这 些 方法 中 它们 是 相同 的 。 

24. 请 解释 Java 字 节 码 。 

25. 举例 说 明基 于 堆栈 的 架构 和 基于 通用 寄存 器 的 架构 。 它 们 有 何不 同 ? 
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习题 

1. 假设 某 台 计算 机 采用 字 节 寻 址 ,使 用 32 位 整数 ， 要 从 地 址 0 开始 存储 十 六 进 制 数 1234， 则 : 

* a) 给 出 大 端 方式 是 如 何 存 储 的 。 

*b) 给 出 小 端 方式 是 如 何 存 储 的 。 

c) 如 果 将 这 个 数值 增 大 到 123456， 则 大 端 和 小 端 方式 中 ， 在 字 节 对 齐 的 情况 下 哪 种 存储 方式 更 高 效 ? 
给 出 你 的 理由 。 

2. 已 知 某 台 计算 机 字 长 32 位 ， 采 用 字 节 寻 址 ， 试 给 出 下 列 各 值 分 别 采 用 小 端 和 大 端 方式 时 的 存储 情况 。 
假设 每 个 值 的 起 始 地 址 都 是 10,。。 夯 出 每 种 存储 方式 的 存储 器 示意 图 ， 并 标 出 每 个 地 址 存储 的 内 容 。 
a) 0x456789Al b) 0x0000058A c) Ox14148888 

3. 填充 下 面 的 表格 以 展示 出 在 2 的 补 码 表示 的 机 器 中 ， 给 定 整 数 是 如 何 表示 的 ,假设 每 个 数值 都 用 16 位 
来 表示 。 
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4. 假设 某 台 计算 机 的 整数 字 长 为 32 位 ， 写 出 以 下 各 值 在 内 存 中 是 如 何 按照 顺序 存储 的 。 假 设 起 始 地 址 为 
0x100， 每 个 地 址 中 存放 一 个 字 节 。 确 保 每 个 值 都 被 扩展 到 合适 的 位 数 。 需 要 增加 行 (地 址 ) 来 存储 给 定 值 。 


小 端 方式 





























a) OxAB123456 b) 0x2BF876 c) 0x8BOA1 
d) Oxl e) OxFEDC1234 
5. 假设 一 个 32 位 的 十 六 进 制 数 在 内 存 中 按 如 下 方式 存储 : 
地 址 ， 数值 
100 2A 102 08 
101 C2 103 1B 


a) 假设 机 器 采用 大 端 存 储 方式 ， 且 用 2 的 补 码 形式 表示 整数 ， 写 出 在 地 址 100 中 存储 的 这 个 32 位 整 
数 的 值 (可 以 用 十 六 进 制 表示 )。 

b) 若 机 器 为 大 端 方式 ， 且 这 个 数字 表示 一 个 IEEE 单 精 度 浮 点 数 ， 那 么 此 浮 点 数 是 正 数 还 是 负数 ? 

c) 若 机 器 为 大 端 方式 ， 且 这 个 数字 表示 一 个 IEEE 单 精 度 浮 点 数 ， 请 给 出 地 址 100 中 存放 的 等 价 十 进 
制 数 (可 以 将 答案 用 科学 计数 法 表示 ， 写 成 2 的 宕 的 形式 ) 。 

d) 假设 机 器 采用 小 端 存储 方式 ， 且 用 2 的 补 码 形式 表示 整数 ， 写 出 在 地 址 100 中 存储 的 这 个 32 位 整 
数 的 值 ( 可 以 用 十 六 进 制 表示 ) 。 

e) 若 机 器 为 小 端 方式 ， 且 这 个 数字 表示 一 个 IEEE 单 精度 浮 点 数 ， 那 么 此 浮 点 数 是 正 数 还 是 负数 ? 

f) 若 机 器 为 小 端 方式 ， 且 这 个 数字 表示 一 个 IEEE 单 精 度 浮 点 数 ， 请 给 出 地 址 100 中 存放 的 等 价 十 进 
制 数 (可 以 将 答案 用 科学 计数 法 表示 ， 写 成 2 的 寡 的 形式 ) 。 

6. 已 知 一 个 2M x 16 的 存储 器 ， 前 两 个 字 节 存放 的 十 六 进 制 值 如 下 所 示 ; 

s 守节 0 中 尖 取 

e 字 节 1 中 为 01 

如 果 这 些 字 节 表示 一 个 十 六 位 的 以 2 的 补 码 形式 表示 的 整数 ， 那 么 当 存储 器 按 如 下 存储 形式 时 ， 其 实 

际 存储 的 十 进 制 值 是 多 少 ? 


a) 按 大 端 方式 存储 b) 按 小 端 方式 存储 
7. 如 果 你 希望 将 一 个 数据 从 大 端 计算 机 传输 到 小 端 计算 机 ， 那 么 你 能 想到 的 字 节 顺序 不 同 会 引起 哪 类 问 
题 ? 请 解释 。 


8. 人 口 研究 所 监控 着 美国 的 人 口 情况 。2008 年 ， 研 究 所 编写 了 一 个 程序 来 创建 表示 各 州 人 口 数量 的 文 
件 ， 也 包括 美国 总 人 口 的 文件 。 这 一 程序 运行 在 Motorola 的 处 理 器 上 ， 基 于 不 同 的 规则 ， 比 如 每 年 平 
均 出 生 和 和 死亡 的 人 数 来 呈现 人 口 的 数量 。 研 究 所 运行 此 程序 并 将 输出 文件 传送 到 州立 机 构 ， 因 此 这 些 
数值 可 作为 输入 传递 给 不 同 的 应 用 程序 。 然 而 ， 一 个 宾夕法尼亚 的 代理 机 构 是 在 Intel 机 器 上 运行 这 个 
程序 的 ， 它 遇 到 了 如 下 问题 : 当 32 位 无 符号 整数 1D2F37E81 (代表 对 整个 美国 2013 年 的 人 口 预测 ) 当 
作 输 入 时 ， 这 个 机 构 的 程序 简单 地 输出 了 这 个 输入 值 ， 对 2014 年 的 美国 人 口 数 量 的 预测 值 太 大 了 。 
你 能 帮助 这 个 代理 机 构 分 析 一 下 是 哪里 可 能 出 错 了 吗 ? (提示: 程序 运行 在 不 同 的 处 理 器 上 。) 

9. 有些 原 因 使 机 器 设计 者 想 让 所 有 指令 具有 相同 的 长 度 。 但 为 什么 对 一 个 堆栈 计算 机 来 说 ， 这 并 不 是 一 
个 好 方案 ? 

4 10. 某 台 计算 机 的 指令 字 长 为 32 位 ， 地 址 码 长 12 位 。 假 设 有 250 条 双 地 址 指令 ， 问 还 能 设计 多 少 条 单 地 
址 指令 ? 请 解释 你 的 答案 。 
11. 将 下 述 中 组 表达 式 转换 为 后 级 表达 式 ( 逆 波 兰 式 ): 
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12. 


. 


13. 


14. 


15. 
16. 


Ly 


18. 


19. 


* 21. 


a) (8 -6)/2 b) (2+3) x8/10 c) [5x(4+3) x2-6] 
将 下 述 中 级 表达 式 转 换 为 后 级 表达 式 ( 逆 波 兰 式 ) : 
a) XxY+WxZ+VxU b) WxX+Wx(UxV+2Z) 


c) |Wx[X+Yx(UxV)]I/[Ux(X+Y)] 
将 下 述 逆 波兰 式 转换 为 中 组 表达 式 : 


a)12831+-/ by) 242 TR cc)357+21-x1++ 
将 下 述 逆 波兰 式 转 换 为 中 级 表达 式 : 
a) WXYZ-+x b)UVWXYZ+x+x+ c)XYZ+VW-XZ++ 


解释 在 习题 13 中 如 何 利用 堆栈 对 逆 波 兰 表 达 式 求 值 。 
a) 将 下 述 表达 式 写 成 道 波兰 式 。 记 住 算 术 运 算 符 的 优先 级 。 
A-B+Cx(DxE-F) 
G+HxK 
b) 编写 一 个 程序 对 上 述 算术 表达 式 进 行 求 值 ， 要 求 使 用 基于 堆栈 的 计算 机 和 零 地 址 指令 ( 仅 Pop 和 
Push 指令 能 够 访问 内 存 ) 。 
a) 已 知 在 某 计算 机 的 指令 格式 中 ,指令 字 长 是 11 位 ， 每 个 地 址 字段 长 4 位 。 那 么 如 下 的 指定 格式 是 
否 是 可 能 的 ? 解释 你 的 答案 。 
@ 5 条 双 地 址 指令 
@ 45 条 单 地 址 指令 
@ 32 条 零 地 址 指令 
b) 假设 在 某 计算 机 的 指令 集 架 构 中 使 用 上 述 的 指令 格式 已 经 设计 了 6 条 双 地 址 指令 和 24 条 零 地 址 指 
令 。 那 么 最 多 还 能 设计 多 少 条 单 地 址 指令 ? 
假设 某 计 算 机 有 如 下 指令 格式 : 一 个 操作 码 和 三 个 寄存 器 值 或 是 一 个 寄存 器 值 和 一 个 地 址 。 那 么 在 
这 台 机 器 上 的 ADD 指令 可 以 使 用 哪些 可 变 的 指令 格式 ? 
对 于 给 定 的 16 位 指令 ,假设 共有 32 个 寄存 器 ， 可 以 设计 如 下 的 扩展 操作 码 吗 ? 如果 可 以 ， 给 出 具体 
编码 。 如 果 不 能 ， 请 解释 原因 。 
e 60 条 双 地 址 指令 ， 操 作 数 存放 在 寄存 器 中 ; 
e 30 条 单 地址 指令 ， 操 作 数 存放 在 寄存 器 中 ; 
@ 3 条 单 地 址 指令 ， 地 址 码 10 位 ; 
e 26 条 零 地 址 指令 。 


> = 





. 直接 寻 址 和 间接 寻 址 的 区 别 是 什么 ? 请 举例 说 明 。 


假设 已 知 指令 Load 1000。 下 图 给 出 了 在 存储 器 中 存储 的 部 分 值 和 在 寄存 器 R1 中 存放 的 值 : 





并 且 假 设 RI 在 变 址 寻 址 方式 中 是 隐 含 的 寄存 器 ， 给 出 读 人 累加 器 的 实际 值 并 填充 下 表 : 





寻 址 方式 装 入 AC 中 的 什 装 入 AC 中 的 什 
立即 寻 址 间接 寻 址 





直接 寻 址 变 址 寻 址 














23. 


25. 


26. 


29. 


*30. 


一 个 非 流水 线 系统 处 理 一 个 任务 需要 200ns。 同 样 的 任务 可 以 在 一 个 5 阶段 流水 线 上 进行 处 理 ， 其 时 
钟 周期 为 40ns。 请 给 出 流水 线 实现 200 个 任务 的 加 速 比 。 流 水 线 和 非 流 水 线 单元 相 比 ， 最 大 加 速 比 
可 以 达到 多 大 ? 
. 一 个 非 流水 线 系统 处 理 一 个 任务 需要 100ns。 同 样 的 任务 可 以 在 一 个 5 阶段 流水 线 上 进行 处 理 ， 其 时 
钟 周期 为 20ns。 请 给 出 流水 线 实现 100 个 任务 的 加 速 比 。 流 水 线 和 非 流水 线 单元 相 比 ， 理 论 上 的 最 
大 加 速 比 可 以 达到 多 大 ? 
假设 和 例 5. 12 中 有 相同 的 阶段 ， 解 释 以 下 每 一 个 代码 段 里 潜在 的 流水 线 冒 险 ( 如 果 有 ) 。 
a) X=R2+Y b) RLI =R2 +X 

R4=R2+X X=R3+Y 

Z=RI1 +X 


在 三 地 址 、 双 地 址 、 单 地 址 和 零 地 址 机 器 上 分 别 编写 代码 来 实现 表达 式 4= (B+C) x (D+E)。 与 程 
序 设计 语言 练习 的 要 求 一 致 ， 求 解 表达 式 时 不 应 改变 操作 数 的 值 。 


- 已 知 一 台数 字 计 算 机 的 存储 器 单元 中 每 一 个 字 的 大 小 为 24 位。 指令 集 包含 150 种 不 同 的 操作 。 所 有 


指令 都 有 一 个 操作 码 字段 (操作 码 ) 和 一 个 地 址 码 地 段 (只 允许 有 一 个 地 址 ) 。 每 条 指令 都 存储 在 一 个 
存储 字 中 。 

a) 操作 码 字段 需要 多 少 位 ? 

b) 指令 中 的 地 址 码 部 分 还 有 多 少 位 剩余 ? 

c) 存储 器 可 允许 的 最 大 空间 是 多 少 ? 

d) 一 个 存储 字 中 可 表示 的 最 大 无 符号 二 进 制 数 是 多 大 ? 


. 某 计算 机 存储 单元 的 容量 是 每 32 位 有 256K 字 。 其 指令 格式 包含 4 个 字段 : 一 个 操作 码 字段 ， 一 个 方 


式 字段 以 指定 7 种 寻 址 方式 中 的 一 种 ， 一 个 寄存 器 地 址 地 段 以 指定 60 个 寄存 器 中 的 某 一 个 ， 以 及 一 
个 存储 器 地 址 字段 。 假 设 一 条 指令 的 长 度 为 32 位 。 回 答 以 下 问题 : 

a) 寻 址 方式 的 字段 多 大 ? b) 寄存 器 的 字段 多 大 ? 

c) 存储 器 地 址 的 字段 多 大 ? d) 操作 码 的 字段 多 大 ? 

假定 在 一 个 非 流水 线 CPU 中 ， 执 行 一 条 指令 需要 4 个 时 钟 周 期 : 一 个 时 钟 周 期 取 指 令 ， 一 个 时 钟 周 
期 对 指令 译 码 ， 一 个 时 钟 周 期 实现 ALU 操作 ， 最 后 一 个 时 钟 周 期 存储 结果 。 对 一 个 有 4 阶段 流水 线 
的 CPU 来 说 ， 指 令 仍然 需要 4 个 时 钟 周 期 来 执行 ， 因 此 ， 怎 样 才能 说 流水 线 加 速 了 程序 的 执行 呢 ? 
挑选 一 种 指令 集 架 构 ( 不 同 于 本 章 介绍 的 ) 。 研 究 一 下 ， 找 出 这 种 架构 是 如 何 运 用 本 章 讲 过 的 这 些 概 
念 的 ， 就 像 我 们 对 Intel 、MIPS 和 Java 分 析 的 一 样 。 
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是 非 题 

1. 大 多 数 计算 机 都 属于 以 下 3 种 CPU 组 织 中 的 一 种 : (1) 通 用 寄存 器 型 ; (2) 单 累加 器 型 ; (3 ) 堆 栈 型 。 
2. 零 地 址 指令 计算 机 的 优点 是 能 有 更 短 的 程序 ， 缺 点 是 指令 需要 的 位 数 很 多 ， 从 而 使 指令 很 长 。 

3. 一 条 指令 在 使 用 了 指令 流水 线 的 处 理 器 上 执行 比 在 非 流水 线 处 理 器 上 执行 花费 的 时 间 少 。 

4. 术语 “ 端 ” 指 的 是 一 种 体系 结构 的 字 节 顺序 。 

5. 堆栈 结构 有 良好 的 代码 密度 和 计算 表达 式 的 简单 模型 ， 但 不 允许 随机 访问 ， 这 会 引起 高 效 代码 的 生成 问题 。 
6. 当今 的 大 多 数 指令 集 架 构 都 是 基于 累加 器 的 。 

7. 定 长 指令 格式 通常 比 变 长 指令 格式 有 着 更 好 的 性 能 。 

8. 相对 于 不 使 用 扩展 操作 码 ， 扩 展 操作 码 会 使 指令 译 码 更 简单 。 

9. 指令 集 正 交 指 的 是 在 指令 集 架构 中 每 一 条 指令 都 有 一 条 实现 相同 操作 的 “备用 ”指令 的 特性 。 


10. 操作 数 的 有 效 地 址 是 存储 器 中 实际 的 地 址 值 。 
11. 在 指令 流水 线 中 当 多 条 指令 需要 相同 的 资源 时 会 发 生 资 源 冲 突 。 
12. 在 流水 线 中 当 多 条 指令 需要 CPU 时 会 发 生 数据 依赖 。 
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大 多 数 计算 机 都 遵循 冯 : 诺 依 曼 结构 ， 这 一 结构 以 存储 器 为 中 心 。 实 现 处 理 功能 的 程序 要 
存放 在 存储 器 中 。 在 第 3 章 ， 我 们 讨论 了 一 个 小 的 4 x3 位 的 存储 器 ， 并 且 在 第 4 章 和 第 5 章 我 
们 知道 了 如 何 访 问 存储 器 。 众 所 周知 ， 存 储 器 在 逻辑 上 是 一 个 地 址 线性 数组 的 结构 ， 从 0 地 址 
开始 一 直到 处 理 器 能 访问 的 最 大 内 存 地 址 。 本 章 我 们 会 研究 各 种 各 样 的 存储 器 ， 以 及 存储 器 结 
构 中 每 一 个 部 分 的 层次 结构 。 接 着 ， 我 们 会 剖析 高 速 缓存 (一 种 专门 的 高 速 存储 器 ) ， 以 及 一 
种 通过 页 式 虚拟 存储 器 来 最 大 限度 利用 存储 器 的 方法 。 


6.2 存储 器 类 型 

“计算 机 存储 器 为 什么 会 有 那么 多 种 类 型 ?” 这 是 人 们 常 问 的 一 个 问题 。 答 案 就 是 不 断 出 
现 的 新 技术 试图 匹配 CPU 的 改进 一 一 存储 器 的 速度 在 某 种 程度 上 不 得 不 跟 上 CPU 的 脚步 ， 或 
者 说 存储 器 已 成 为 一 个 瓶颈 。 尽 管 我 们 已 经 看 到 在 过 去 的 几 十 年 里 CPU 有 了 很 大 的 进步 ,但 
提升 主 存 性 能 来 跟 上 CPU 的 步伐 其 实 并 不 是 很 关键 ， 因 为 我 们 采用 了 高 速 缓 存 。 高 速 缓存 是 
一 个 小 的 高 速 (高 成 本 ) 存 储 器 ， 作 为 经 常 访问 数据 的 缓冲 区 。 对 于 存储 器 来 说 ， 使 用 快速 存 
储 技术 的 额外 代价 通常 是 不 好 判断 的 ， 因 为 慢 速 存储 器 的 真实 性 能 往往 被 高 性 能 高 速 缓存 系统 
给 隐藏 了 。 但 是 ， 在 讨论 高 速 缓存 之 前 ， 我 们 将 解释 不 同 的 存储 技术 。 

尽管 存在 大 量 的 存储 技术 ,但 存储 器 类 型 仅 有 两 种 随机 存 取 存储 器 ( RAM ) 和 只 读 存 储 
器 (ROM) 。 某 种 程度 上 ，RAM 是 一 种 误 称 ， 一 个 更 合适 的 名 字 是 可 读 写 存储 器 。RAM 是 计算 
机 说 明 书 中 所 指 的 存储 器 ， 如 果 你 买 了 一 台 存 储 容 量 为 128MB 的 计算 机 ， 则 它 就 有 128MB 的 
RAM。RAM 也 是 “ 主 存 ” 的 一 种 叫 法 ， 这 和 我 们 在 本 书 中 不 断 提 到 的 一 样 。RAM 常 被 称 为 主 
存储 器 ， 用 来 存储 在 计算 机 执行 程序 时 需要 用 到 的 程序 和 数据 。 但 RAM 具有 易 失 性 ， 一 旦 断 
电 ， 里 面 存储 的 信息 就 会 消失 。 现 代 计 算 机 中 有 两 种 通用 芯片 来 构造 大 容量 的 RAM: SRAM 
(静态 随机 存 取 存储 器 ) 和 DRAM( 动态 随机 存 取 存 储 器 ) 。 

动态 RAM 是 由 会 漏电 的 微小 电容 组 成 的 。 为 了 维持 其 中 存储 的 数据 ，DRAM 每 隔 几 毫秒 
就 需要 充电 一 次 。 相 反 ， 静 态 RAM 在 通电 时 可 以 长 时 间 保 持 内 容 不 变 。SRAM 是 由 类 似 于 第 3 
章 中 学 过 的 D 触发 器 电路 组 成 的 。SRAM 比 DRAM 速度 快 ， 但 是 也 更 昂贵 。 然 而 ， 设 计 者 之 所 
以 使 用 DRAM ， 是 因为 其 更 密集 ( 每 个 芯片 上 可 以 存储 更 多 的 二 进 制 位 ) ， 耗 电量 更 小 ， 并 且 比 
SRAM 散热 少 。 由 于 这 些 原因 ， 这 两 种 技术 经 常 混 合 使 用 : DRAM 用 作 主 存 而 SRAM 用 作 高 速 
缓存 。 所 有 DRAM 存储 器 的 基本 操作 都 是 相同 的 ， 但 是 有 很 多 不 同 的 种 类 ， 包括 多 体 DRAM 
(MDRAM ) 、 快 速 页 模式 ( FPM ) DRAM、 扩 展 数 据 输出 (EDO)DRAM、 突 发 式 EDO DRAM 
(BEDO DRAM)、 同 步 动 态 随 机 存 取 存储 器 (SDRAM)、 同 步 链接 (SL) DRAM、 双 倍速 
(DDR)SDRAM、Rambus DRAM( RDRAM ) 和 直接 Rambus ( DR) DRAM。 不 同类 型 的 SRAM 
包括 异步 SRAM、 同 步 SRAM 和 流水 线 突 发 式 SRAM。 关 于 这 些 存 储 器 的 更 多 信息 ， 请 参阅 本 
章 末 尾 的 参考 文献 。 

除了 RAM 之 外 ， 大 多 数 计算 机 还 有 一 个 小 容量 的 ROM， 它 存放 操控 系统 需要 的 一 些 关 键 
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言 息 ， 比 如 启动 计算 机 所 必需 的 程序 。ROM 是 非 易 失 性 的 ， 可 以 长 久保 存 数据 。 这 种 类 型 的 
存储 器 也 经 常用 于 嵌入 式 系统 或 者 任何 不 需要 改变 程序 的 系统 。 很 多 家 用 电器 、 玩 具 和 大 多 数 
汽车 在 断 电 时 都 使 用 ROM 芯片 来 保存 信息 。ROM 也 经 常 广泛 应 用 于 计算 器 和 外 设 中 ， 比 如 激 
光 打 印 机 就 用 ROM 来 存储 字体 。ROM 有 5 种 基本 类 型 : ROM、PROM、EPROM、EEPROM 和 
闪存 。PROM( 可 编程 只 读 存储 器 ) 是 ROM 的 一 种 变 体 。 用 户 能 够 利用 合适 的 设备 来 对 PROM 
进行 编程 。 由 于 ROM 是 硬 连 线 的 ， 所 以 PROM 通过 熔 丝 将 程序 烧 写 到 芯片 上 。 一 旦 编写 好 程 
序 ，PROM 上 的 数据 和 指令 就 不 能 改变 了 。EPROM (可 擦 写 PROM ) 是 可 编程 的 ， 它 的 优点 就 
是 可 以 重新 编程 ( 擦 除 EPROM 需要 一 个 能 发 出 紫外 线 的 专门 工具 )。 为 了 对 EPROM 进行 重新 
编程 ， 必 须 先 擦 除 整 个 芯片 。EEPROM ( 电 可 擦 除 PROM ) 克服 了 EPROM 的 很 多 缺点 : 不 需要 
专门 工具 来 擦 除 信 息 (通过 施加 电场 来 实现 ) ， 并 且 可 以 擦 除 忆 片上 任意 部 分 的 信息 ,一 次 一 
个 字 节 。 闪 存 是 一 种 特殊 的 EEPROM， 它 的 优点 是 信息 可 以 成 块 地 写 和 或 擦 除 ， 而 不 受 一 次 擦 
除 一 个 字 节 的 限制 。 这 使 得 闪存 比 EEPROM 的 速度 快 。 闪 存 已 经 成 为 一 种 非常 流行 的 存储 设 
备 ， 而 且 用 在 很 多 不 同 的 设备 中 ,包括 手机 、 数 码 相 机 以 及 音乐 播放 器 。 它 也 已 经 用 在 了 固态 
磁盘 存储 器 中 。( 关 于 闪存 的 更 多 内 容 见 第 7 章 。) 


6.3 存储 器 的 层次 结构 

在 理解 现代 处 理 器 性 能 方面 ， 存 储 器 的 层次 结构 是 最 重要 的 因素 之 一 。 但 是 ， 就 像 我 们 所 
看 到 的 一 样 ， 并 非 所 有 的 存储 器 都 是 相同 的 ， 有 些 存储 器 效率 很 低 ， 因 此 价格 就 比 其 他 类 型 的 
存储 器 要 低 。 为 了 解决 存储 器 之 间 的 差异 ， 现 代 计算 机 系统 采用 多 类 型 存储 器 的 组 合 ， 从 而 以 
最 优 的 价格 提供 最 好 的 性 能 。 这 种 方法 称 为 分 层 存储 器 。 经 验 法 则 是 ， 更 快 的 存储 器 ， 每 位 的 
存储 价格 就 更 昂贵 。 使 用 分 层 的 存储 结构 可 使 每 一 层 的 访问 速度 和 存储 容量 都 不 同 ， 这 种 计算 
机 系统 可 以 比 那些 不 采用 多 类 型 分 层 存储 结构 的 系统 获得 更 高 的 性 能 。 组 成 分 层 存储 结构 的 基 
本 存储 器 类 型 包括 寄存 器 、 高 速 缓存 、 主 存 、 辅 存 和 离线 大 容量 存储 器 。 

处 理 器 是 可 以 直接 访问 寄存 器 的 。 高 速 缓存 是 一 个 有 着 极 高 速度 的 存储 器 ， 里 面 存放 的 内 
容 经 常 被 主 存 访问 。 高 速 缓存 连接 着 一 个 大 容量 的 主 存 ， 而 主 存 是 典型 的 中 速 存储 器 。 主 存 的 
后 备 存储 是 超大 容量 的 辅 存 ， 辅 存 通常 由 硬盘 组 成 ， 而 硬盘 不 能 被 CPU 直接 访问 ; 取而代之 
的 是 ， 当 CPU 需要 辅 存 中 的 数据 时 它 必 须 将 内 容 传 给 主 存 。 硬 盘 可 以 是 磁盘 或 者 固态 硬盘 ( 基 
于 闪存 的 硬盘 存储 器 ， 其 速度 比 旋转 的 磁盘 存储 器 快 且 更 耐用 ) 。 离 线 大 容量 存储 器 (包含 第 
三 级 存储 器 和 离线 存储 器 ) 中 的 数据 在 被 访问 之 前 需要 人 工 或 者 机 器 干预 ,数据 必须 传送 到 辅 
存 的 存储 体 上 。 第 三 级 存储 器 包含 光盘 和 磁带 等 存储 设备 ， 它 们 通常 处 于 机 械 控制 之 下 (由 机 
械 臂 安装 和 拆 印 磁带 和 磁盘 ) 。 第 三 级 存储 器 用 于 企业 中 的 大 型 系统 和 网 络 的 存储 ， 这 是 一 般 
的 计算 机 用 户 看 不 到 的 。 这 些 设备 通常 有 着 不 均匀 的 访问 时 间 ， 检 索 数据 的 时 间 取 决 于 这 台 设 
备 是 否 被 装载 了 。 脱 机 存储 器 包括 那些 已 连接 、 已 装载 数据 ， 并 且 随 后 就 会 与 系统 断 开 连接 的 
设备 ， 比 如 软盘 、 闪 存 设备 、 光 盘 和 可 拆 印 的 硬盘 。 通 过 使 用 存储 器 层次 结构 ， 仅 仅 使 用 一 个 
小 容量 快速 (昂贵 ) 的 芯片 ， 我 们 就 可 以 提高 存储 器 的 访问 效率 。 这 使 得 设计 者 可 以 用 合理 的 
成 本 来 搭建 一 台 成 本 可 接受 的 计算 机 。 

我 们 根据 与 处 理 器 的 距离 来 划分 存储 器 的 类 型 ， 距 离 是 通过 访问 所 需要 的 机 器 周期 个 数 来 
测量 的 。 与 处 理 器 越 近 的 存储 器 ， 速 度 就 应 该 越 快 。 如 果 存 储 器 距离 处 理 器 较 远 ， 就 需要 花费 
更 长 的 存 取 时 间 。 因 而 ， 速 度 较 慢 的 技术 用 在 离 处 理 器 较 远 的 存储 器 中 ， 而 更 快 的 技术 则 用 在 
离 CPU 更 近 的 存储 器 上 。 技 术 水 平 越 高 ,存储器 就 会 变 得 越 快 ， 但 也 越 贵 。 由 于 成 本 原因 ， 
快速 存储 器 比 慢 速 存储 器 的 容量 更 小 。 

当 提 到 存储 器 层次 结构 时 ， 以 下 是 一 些 会 用 到 的 术语 : 
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。 命中 : 要 访问 的 信息 存在 于 给 定 层次 的 存储 器 中 (典型 地 ， 我 们 仅 关心 较 高 层次 存储 器 
的 命中 率 ) 。 
。 失效 : 要 访问 的 信息 在 给 定 层次 的 存储 器 中 没有 找到 。 
。 命中 率 : 在 给 定 层次 的 存储 器 中 找到 所 需 信 息 的 比率 。 
e 失效 率 : 在 给 定 层 次 的 存储 器 中 没有 找到 所 需 信 息 的 比率 。 注 : 失效 率 =1 - 命中 率 。 
e 命中 时 间 : 在 给 定 层次 的 存储 器 中 访问 所 需 信 息 需 要 的 时 间 。 
。 失效 惩罚 : 处 理 一 次 失效 所 需要 的 时 间 ， 包 括 在 较 高 层次 存储 器 中 蔡 换 一 个 块 的 时 间 和 
将 所 需 数据 传 给 处 理 器 所 需要 的 额外 开销 。( 处 理 一 次 失效 需要 的 时 间 比 处 理 一 次 命中 
所 需要 的 时 间 明 显 长 很 多 。) 
存储 器 的 层次 结构 可 以 用 图 6-1 来 描述 。 金 字 塔 型 结构 有 助 于 揭示 各 种 存储 器 类 型 的 相对 
空间 的 大 小 。 越 接近 金字 塔 顶 端的 存储 器 ， 其 空间 越 小 。 然 而 ， 越 小 的 存储 器 具有 的 性 能 越 
高 ， 因 此 就 导致 了 它 比 金字 塔 底 端 存储 器 的 每 位 价格 要 高 。 金 字 塔 左边 的 数字 表示 传统 的 访问 
时 间 ， 它 通常 都 是 自 顶 向 下 逐渐 增加 的 。 一 般 来 说 ， 寄 存 器 访问 需要 一 个 时 钟 周期 。 


更 少 、 成 本 更 高 
访问 时 间 





图 6-1 存储 器 的 层次 结构 


由 于 新 技术 的 出 现 ， 当 我 们 沿 着 金字 塔 结构 向 下 看 访问 时 间 时 ， 有 一 个 例外 。 脱 机 存储 
器 的 访问 速度 要 比 大 多 数 的 第 三 级 存储 设备 快 。 其 中 很 有 趣 的 就 是 USB 内存。 固态 硬 盘 和 
USB 闪存 使 用 相同 的 技术 ， 因 此 就 访问 设备 上 的 数据 而 言 ， 它 们 有 着 非常 相似 的 访问 速度 。 
然而 ，USB 闪存 的 访 存 时 间 却 比 固 态 硬盘 慢 ， 原 因 就 在 于 USB 接口 。 即 便 如 此 ，USB 闪存 
也 比 其 他 非 固态 类 型 离线 存储 器 的 访问 速度 快 。 可 移动 硬盘 的 访问 时 间 在 12 ~40ms， 而 
USB 闪存 的 访问 时 间 在 0.5 ~ 33ms。 若 只 考虑 访问 时 间 ， 后 面 的 存储 器 并 不 属于 金字 塔 的 
底部 。 

图 6-1 不 仅 表示 存储 器 的 层次 结构 ， 也 表示 存储 的 层次 结构 。 我 们 往往 对 存储 器 层次 结构 
更 感 兴趣 ， 它 包括 寄存 器 、 高 速 缓存 、 主 存 和 虚拟 存储 器 ( 非 系统 存储 器 ， 它 的 行为 类 似 于 对 
主 存 的 扩充 一 一 本 章 后 面 会 讨论 ) 。 虚 拟 存储 器 通常 用 硬盘 来 实现 ， 它 给 人 如 下 印象 : 一 个 程 
序 可 以 有 很 大 的 连续 工作 的 主 存 ， 而 事实 上 程序 在 主 存 或 磁盘 中 可 能 是 分 片 存放 的 。 虚 拟 存储 
器 通 过 扩充 从 RAM 到 硬盘 的 地 址 空间 ， 提 高 了 计算 机 存储 器 的 空间 利用 率 。 一 般 来 说 ， 存 储 
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器 的 层次 结构 会 停止 在 硬盘 这 一 层 。 但 是 ， 随 着 固态 存储 技术 的 到 来 ， 虚 拟 存储 器 的 定义 也 发 
生 了 改变 。 我们 之 前 提 到 了 USB 闪存 有 着 非常 快 的 访问 速度 。 事 实 上 ， 它 们 的 速度 非常 快 ， 
以 至 于 某 些 操作 系统 (包括 一 些 版 本 的 UNIX 和 Windows XP 以 及 后 来 版 本 ) 都 允许 用 户 将 USB 
闪存 作为 虚拟 存储 器 来 使 用 。 上 面 提 到 的 Windows 操作 系统 带 有 一 个 叫 作 ReadyBoost 的 软件 ， 
它 使 得 各 种 各 样 的 可 移动 固态 外 设 ( 比如 USB 闪存 和 SD 卡 ) 能 够 以 磁盘 缓存 的 形式 扩充 虚拟 存 
储 器 。 这 些 固态 设备 的 速度 比 传统 的 硬盘 快 了 100 倍 ， 虽 然 它们 没有 取代 硬盘 ， 但 也 迅速 成 为 
一 种 令 人 感 兴趣 的 扩充 存储 空间 的 设备 。 

对 任意 给 定 的 数据 ， 处 理 器 发 送 数据 请 求 到 存储 器 中 最 快 、 最 小 的 部 分 (通常 是 高 速 缓存 ， 
因为 寄存 器 越 来 越 趋 于 专用 ) 。 如 果 在 缓存 中 找到 数据 ， 那 么 它 很 快 就 会 传 进 CPU。 如 果 数 据 
没有 在 缓存 中 ， 则 请 求 将 会 进一步 传 到 下 一 个 更 低 一 级 的 层次 ， 重 新 开始 查找 过 程 。 如 果 数 据 
在 这 一 层次 中 找到 ， 那 么 这 个 数据 所 在 的 整个 数据 块 都 将 传 给 缓存 。 如 果 在 这 一 层次 存储 器 中 
仍然 没有 发 现 数据 ， 那 么 数据 请 求 将 会 发 送 到 更 低级 的 层次 ， 依 次 类 推 。 这 种 机 制 的 关键 思想 
是 当 低层 次 的 存储 器 ( 速度 慢 、 容 量 大 、 价 格 低 ) 响 应 由 高 层次 存储 器 位 置 X 中 的 数据 发 过 来 
的 请 求 时 ， 它 通常 会 把 位 置 了 周围 (…, -2,， 和 -1，X, X+1, X+2，…) 的 数据 也 发 送 过 
来 ， 这 样 就 会 给 高 层次 的 存储 器 返回 一 整 块 数据 。 这 一 思想 基于 额外 传送 的 数据 在 不 远 的 将 来 
也 会 被 访问 ， 并 且 在 大 多 数 情况 下 事实 也 是 如 此 。 存 储 器 的 层次 结构 是 很 有 用 的 ， 因 为 程序 有 
一 种 叫 作 局 部 性 的 特点 ， 即 处 理 器 总 是 趋 于 去 访问 和 -2、X-1、X+l、X+2 等 地 址 中 的 数 
据 。 因 此 ， 尽 管 这 里 有 一 次 对 缓存 位 置 X 中 的 数据 访问 未 命中 ,但 接 下 来 当 整 个 数据 块 传 到 组 
存 后， 根据 局 部 性 原理 ， 将 会 有 连续 几 次 的 命中 。 


存储 器 的 访问 局 部 性 

实际 上 ， 处 理 器 试图 以 某 种 特定 方式 来 访问 存储 器 。 比 如 说 ， 当 没有 分 支 语句 时 ，MARIE 
系统 中 的 程序 计数 器 (PC) 中 的 值 就 会 在 取 完 一 条 指令 时 自动 增 1。 因 此 ， 如 果 在 上 时 刻 访问 内 
存 地 址 了 ， 那么 在 不 远 的 将 来 就 有 很 大 的 概率 访问 地 址 +1。 对 内 存 的 某 块 连续 地 址 组 团 访问 
就 是 访问 局 部 性 的 一 个 示例 。 通 过 将 存储 絮 设 计 成 层次 结构 可 以 实现 对 局 部 性 的 开发 利用 。 当 
处 理 失效 时 ， 它 会 将 失效 地 址 所 在 的 整个 块 都 传 给 上 一 级 存储 器 ， 而 不 是 仅 简单 地 传送 失效 地 
址 这 个 存储 单元 中 的 内 容 。 由 于 访问 的 局 部 性 ， 看 上 去 就 像 整 个 数据 块 中 的 其 他 数据 在 不 远 的 
将 来 也 会 访问 到 ， 如 果 事实 上 也 是 如 此 的 话 ， 那 么 这 些 数 据 会 从 快速 存储 器 中 取出 。 

下 面 是 访问 局 部 性 的 3 种 基本 形式 : 





不 远 的 将 来 会 再 次 被 访问 。 

人 部 必 下 s 间 中 聚集 ( 比如， 访问 数 组 或 者 循环 操作 ) 。 

问 。 
na 

典型 地 ， 在 任意 给 定时 刻 ， 仅 仅 有 少量 的 存储 空间 被 访问 ， 而 这 些 空间 中 的 值 又 是 重复 访问 

的 。 因 此 ， 我 们 可 以 将 这 些 数值 从 慢 速 存 储 器 中 取出 并 传 给 一 个 容量 更 小 但 速度 更 快 的 上 一 级 

存储 器 。 这 就 使 得 一 个 存储 系统 可 以 用 容量 大 的 低 成 本 存储 器 存放 大 量 信息 ， 但 提供 了 与 使 用 

快速 且 昂 贵 的 存储 器 几乎 相同 的 访问 速度 。 


6.4 ”高 速 缓存 
计算 机 处 理 器 的 运行 速度 很 快 并 且 经 常 需要 从 存储 器 中 读 取 信息 ， 这 也 就 意味 着 处 理 器 需 


要 经 常 等 待 信息 的 到 来 ， 因 为 存储 器 的 访问 速度 比 处 理 器 的 运行 速度 慢 。 高 速 缓存 容量 小 ， 适 
合 临时 性 存储 ， 但 是 速度 快 ， 用 于 存放 处 理 器 很 快 就 会 再 次 访问 的 信息 。 
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我 们 周围 到 处 都 是 缓存 的 例子 。 脑 海中 想 着 这 些 例子 有 助 于 你 理解 计算 机 存储 器 的 缓存 技 
术 。 假 设 某 位 业主 在 自家 仓库 里 有 一 个 非常 大 的 工具 箱 。 你 就 是 这 位 业主 ， 并 且 你 需要 在 原 有 
基础 上 进行 家 装 工程 。 家 装 工程 需要 钻头 、 扳 手 、 锤 子 、 卷 信 、 几 种 锯 子 以 及 不 同类 型 和 斥 二 
的 螺丝 刀 。 首 先 你 要 做 的 就 是 测量 木材 并 切断 它 。 你 跑 回 仓库 ， 从 大 工具 箱 里 拿 出 量 尺 ， 下 到 
地 下 室 测量 木材 ， 再 跑 回 仓库 ， 放 下 量 尺 ， 缴 匆 抓 起 句子 回 到 地 下 室 切 割 木头 。 现 在 你 决定 用 
螺丝 钉 将 几 块 木板 钉 在 一 起 。 为 此 你 又 跑 回 仓库 ， 拿 着 钻头 回 到 地 下 室 ， 钻 孔 以 便 能 使 螺丝 钉 
通过 。 然 后 你 又 回 到 仓库 ， 放 下 钻头 ， 拿 起 扳手 返回 地 下 室 ， 结果 发 现 拿 错 了 尺寸 ， 于 是 又 回 
到 仓库 翻 工 具 箱 ， 拿 起 男 一 把 扳手 下 楼 梯 …… 你 真 的 就 这 样 工作 吗 ? 不 ! 作为 一 个 有 条 理 的 人 
会 想 , “如果 我 需要 一 个 扳手 ， 那 接 下 来 我 可 能 很 快 就 会 需要 另 一 个 不 同 尺寸 的 扳手 ， 那 我 何 
不 将 所 有 扳手 都 拿 着 呢 ?” 更 进一步 你 会 推理 , “一 旦 我 用 完了 某 种 工具 ， 就 有 很 大 概率 会 用 
到 其 他 工具 ， 因 此 我 为 什么 不 拿 一 个 小 工具 箱 并 将 它 放 在 地 下 室 呢 ?” 这 样 的 话 ， 你 就 把 需要 
的 工具 放 在 手边 了 ， 从 而 可 以 快速 拿 到 工具 。 为 了 快速 找到 并 使 用 工具 ， 你 已 经 完成 了 工具 的 
缓存 ! 那些 不 需要 的 工具 会 继续 存放 在 远 处 的 某 个 特定 位 置 ， 等 待 使 用 。 这 就 是 高 速 缓存 所 做 
的 全 部 工作 : 它 将 那些 已 经 访问 并 且 还 要 访问 的 数据 存放 在 靠近 CPU 的 快速 存储 器 里 。 

另 一 个 与 缓存 类 似 的 例子 是 买 杂货 。 假 设 你 偶尔 需要 去 杂货 店 买 一 种 东西 ， 你 买 了 一 些 马 
上 就 需要 的 以 及 一 些 不 久 也 会 需要 的 东西 。 杂 货 店 就 像 主 存 ， 你 家 就 是 高 速 缓存 。 男 一 个 例子 
是 ,考虑 我 们 当中 有 多 少 人 会 随身 携带 整 本 电话 本 。 大 多 数 人 只 会 带 一 个 通讯 录 ， 上 面 写 着 我 
们 经 常 联系 的 人 的 名 字 和 号 码 ， 这 样 ， 在 小 通讯 录 上 查找 号 码 比 在 大 电话 本 上 快 很 多 。 我 们 总 
是 随身 带 着 通讯 录 ， 而 一 般 将 大 电话 本 放 在 家 里 边 桌 或 书柜 的 某 处 。 大 电话 本 是 我 们 不 经 常 使 
用 的 东西 ， 所 以 可 以 将 其 束之高阁。 比较 电话 本 和 通讯 录 的 大 小 ， 会 发 现 通讯 录 的 “ 主 存 ” 
比 电话 本 的 小 多 了 ,但 当 打 电 话 时 在 通讯 录 上 能 查 到 号 码 的 概率 却 很 高 。 

做 科研 的 人 提供 了 男 一 个 缓存 的 例子 。 假 设 你 正在 写 一 篇 关于 量子 计算 的 文章 ， 你 会 去 图 
书馆 借 一 本 书 ， 回 家 ， 找 到 那 本 书 上 的 必要 信息 ， 回 到 图 书馆 ， 又 借 另 一 本 书 ， 又 回 家 ， 如 此 
往复 循环 吗 ? 不 ， 你 会 去 图 书馆 把 所 有 可 能 用 到 的 书 都 借 出 来 并 带 回 家 ， 图 书馆 就 像 主 存 ， 而 
你 家 就 是 缓存 。 

最 后 一 个 例子 ,考虑 是 如 何 使 用 办 公 室 的 。 任 何 用 不 到 的 东西 (或 6 个 月 以 上 都 用 不 上 的 ) 
都 放 在 一 个 大 文件 柜 里 。 但 是 ， 经 常用 到 的 东西 要 放 在 桌面 上 ， 离 手边 近 ， 容 易 取 用 。 如 果 需 
要 从 文件 中 查找 资料 ， 她 总 是 将 整 本 文件 都 拿 出 来 ， 而 不 是 从 文件 夹 中 抽出 一 份 或 两 份 文件 ， 
于 是 这 一 本 文件 就 放 在 桌 上 了 。 这 时 候 , 文件 柜 就 是 她 的 “ 主 存 ”， 而 她 的 办 公 桌 (包括 那些 
未 整理 的 一 把 资料 ) 就 是 缓存 。 

高 速 缓存 的 工作 原理 就 和 上 面 的 这 些 例 子 一 样 ， 它 把 经 常 使 用 的 数据 拷贝 到 缓存 里 ， 而 不 
是 去 访问 主 存 以 获取 这 些 数 据 。 绥 存 可 以 是 那 乱 糟 糟 的 桌面 也 可 以 是 那 工整 的 通讯 录 ， 但 不 管 
怎么 样 ， 缓 存 中 的 数据 都 必须 是 可 以 访问 到 的 (可 定位 的 ) 。 高 速 缓存 和 日 常生 活 中 的 真实 例 
子 有 一 点 显著 不 同 : 计算 机 确实 无 法 事先 得 知 最 有 可 能 访问 的 是 哪些 数据 ， 因 此 ， 需 要 使 用 局 
部 性 原理 ， 并 且 在 需要 访问 主 存 时 将 整 块 数据 从 主 存 传送 到 缓存 中 。 如 果 用 到 块 中 其 他 数据 的 
概率 很 高 ， 那 么 传送 一 整 块 数据 就 会 节省 访 存 时 间 。 新 块 存放 在 缓存 中 的 位 置 取 决 于 两 个 因 
素 : 缓存 映射 策略 (下 一 节 会 讨论 ) 和 缓存 大 小 (影响 到 是 否 有 空间 存放 新 块 ) 。 

缓存 容量 的 变化 可 以 非常 大 。 一 个 典型 的 L2 缓存 容量 为 256K 或 512K。L1 缓存 小 一 点 ， 
容量 通常 是 8K ~ 64K。LI1 缓存 驻 留 在 处 理 器 中 ，L2 在 CPU 和 主 存 之 间 ， 因 此 Ll 比 Z2 更 快 。 
Ll 和 12 之 间 的 关系 可 以 用 上 面 讲 过 的 杂货 店 的 例子 来 描述 : 假设 杂货 店 是 主 存 ， 可 以 将 你 的 
冰箱 视 为 L2， 而 将 餐桌 视 为 Ll。 需要 注意 的 是 ,在 更 新 的 处 理 器 中 ， 某 些 CPU 实际 上 将 [2 
与 Ll 同样 对 待 ， 而 不 是 将 L2 集成 在 主板 上 。 男 外 ， 在 一 些 系统 中 还 设置 了 13 缓存 ，L3 是 和 
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Ll1、12 协同 工作 的 。 

设置 缓存 的 目的 就 是 将 最 近 经 常 使 用 的 数据 存放 在 离 CPU 近 的 位 置 来 加 快 访 存 速度 ， 而 
不 是 将 数据 存储 在 主 存 中 。 尽 管 缓存 的 容量 没有 主 存 那么 大 ， 但 是 它 速度 快 。 主 存 通常 是 由 
DRAM 组 成 的 ， 也 就 是 说 它 的 访问 时 间 是 50ns。 缓 存 通常 是 由 SRAM 组 成 的 ， 存 取 周 期 比 
DRAM 短 ， 因 而 有 更 快 的 访问 速度 。( 典 型 缓存 的 访 存 时 间 为 10ns。) 缓存 不 需要 用 太 大 的 容量 
来 表现 其 优异 的 性 能 ， 一 个 基本 原则 就 是 缓存 的 容量 要 足够 小 ， 以 使 其 每 位 的 平均 成 本 趋 近 于 
主 存 ， 但 又 要 大 到 满足 系统 要 求 。 因 为 这 种 快速 存储 器 价格 昂贵 ， 所 以 不 能 用 缓存 的 技术 来 构 
建 主 存 。 

什么 使 得 缓存 “很 特殊 "? 缓存 不 通过 地 址 来 访问 ， 而 是 通过 内 容 。 基 于 这 一 原因 ， 缓 存 
有 时 也 被 称 为 按 内 容 寻 址 的 存储 器 ( CAM) 。 在 大 多 数 缓存 映射 方案 中 ,会 搜索 整个 缓存 来 确 
认 所 需 数据 是 否 存 放 在 缓存 中 。 为 了 简化 定位 所 需 数据 的 过 程 ， 有 多 种 缓存 映射 算法 。 


6. 4. 1 缓存 映射 策略 


”缓存 要 想 真正 起 到 作用 ， 必 须要 存储 有 用 的 数据 。 但 是 ， 如 果 CPU 找 不 到 这 些 数据 ， 那 
么 它们 就 是 没 用 的 。 当 CPU 访问 数据 或 指令 时 ， 它 会 首先 生成 一 个 主 存 地 址 ， 如 果 数 据 已 经 
拷贝 到 缓存 中 了 ， 那 么 数据 在 缓存 中 的 地 址 和 在 主 存 中 的 地 址 是 不 同 的 。 比 如 说 ， 数 据 在 主 存 
中 位 于 地 址 0x2E3 处 ,但 可 能 放 入 缓存 中 非常 靠 前 的 位 置 。 接 下 来 CPU 如 何 定位 已 经 拷贝 到 
缓存 中 的 数据 呢 ? CPU 使 用 专门 的 映射 方案 将 主 存 地 址 “转换 ”为 缓存 位 置 。 

地 址 转换 是 通过 给 主 存 地 址 位 赋予 特殊 意义 来 完成 的 。 首 先 ， 我们 将 地 址 中 的 各 位 划分 成 
不 同 的 组 ， 每 一 组 称 为 一 个 字段 。 根 据 映 射 方案 ， 可 以 将 其 分 成 两 个 或 三 个 字段 。 如 何 使 用 这 
些 字段 取决 于 所 采用 的 映射 方案 。 映 射 方案 也 决定 了 当 数 据 初 次 拷贝 到 缓存 时 应 该 放 在 哪里 ， 
并 且 也 为 CPU 提供 了 一 种 在 缓存 中 查找 已 拷贝 数据 的 方法 。 映 射 方案 包括 直接 映射 、 全 相 联 
映射 和 组 相 联 映射 。 

在 讨论 这 些 映 射 方案 之 前 ， 理 解数 据 如 何 复制 到 缓存 中 是 非常 重要 的 。 主 存 和 缓存 都 分 成 
大 小 相同 的 块 ( 块 数 不 同 ) ， 当 生成 一 个 主 存 地 址 后 ， 先 查找 缓存 以 查看 所 需 数据 是 否 已 经 拷 
贝 到 缓存 了 。 如 果 在 缓存 中 没 找 到 ， 则 将 数据 所 在 内 存 块 的 全 部 内 容 都 装 入 缓存 中 。 就 像 之 前 
所 提 到 的 ， 这 一 方案 之 所 以 奏效 是 因为 局 部 性 原理 一 一 如 果 一 个 地 址 刚 被 访问 过 ， 那 么 接 下 来 
很 可 能 会 以 相同 模式 访问 它 的 相 令 地址。 因此， 一 个 失效 的 地 址 经 常会 导致 几 次 地 址 查找 。 比 
如 ， 当 你 在 地 下 室 并 且 是 第 一 次 需要 工具 时 ， 你 有 一 次 未 命中 ， 必 须 返 回 仓库 ， 如 果 你 一 下 子 
拿 了 一 堆 你 认为 可 能 会 用 到 的 工具 并 回 到 地 下 室 ， 你 肯定 希望 在 接 下 来 的 过 程 中 会 有 几 次 “ 命 
中 ”( 即 正好 需要 这 些 工具 ) ， 这 样 你 就 不 用 浪费 时 间 去 仓库 里 取 了 。 因 为 访问 缓存 中 的 数据 
(已 经 放 到 地 下 室 的 工具 ) 比 到 主 存 中 去 取 ( 再 次 跑 到 仓库 里 ) 要 快 ， 所 以 缓存 节省 了 整个 访问 
时 间 。 

那么 ， 如 何 使 用 主 存 地 址 中 的 字段 呢 ? 其 中 一 个 字段 指明 了 该 数据 存储 在 缓存 中 的 位 置 ， 
当然 前 提 是 数据 已 经 拷贝 到 缓存 中 (这 种 情况 叫 缓存 命中 ) ， 或 者 当 数 据 不 在 缓存 中 时 ， 指 明 
其 存放 的 位 置 (此 时 叫 缓存 失效 ) 。( 这 和 相 联 映射 有 些 不 同 ， 后 面 很 快 会 讲 到 。) 被 指明 的 缓存 
块 接 下 来 将 会 检查 其 是 否 有 效 ， 这 通过 给 每 个 块 配备 的 一 个 有 效 位 来 实现 。 有 效 位 为 0 表示 当 
前 缓存 块 的 内 容 是 无 效 的 (缓存 失效 ) ， 接 下 来 必须 访问 主 存 。 有 效 位 为 1 表示 当前 块 有 效 ( 可 
能 是 命中 了 ， 但 还 要 完成 多 步 才能 确认 ) 。 接 下 来 ,我们 需要 比较 给 定 地 址 中 的 标记 字段 和 组 
存 块 中 的 标记 字段 (标记 字段 是 从 主 存 地 址 中 提取 出 来 的 一 个 位 组 ， 它 也 存储 在 缓存 的 相应 块 
中 ) 。 如 果 标 记 位 相同 ， 就 意味 着 找到 了 最 终 的 缓存 块 ( 即 命 中 ) 。 这 时 ， 需 要 定位 到 缓存 块 中 
的 数据 ， 这 可 以 通过 主 存 地 址 中 另 一 个 名 为 偏 移 字段 的 部 分 来 完成 。 所 有 的 缓存 映射 方案 都 需 





要 一 个 偏 移 字 段 ， 但 是 ， 其 他 字段 是 否 需要 取决 于 所 采用 的 映射 方案 。 我 们 会 讨论 3 种 主要 的 
缓存 映射 方案 。 在 接 下 来 的 例子 中 ,我 们 假设 缓存 块 为 空 时 表示 无 效 ， 如 果 块 中 有 数据 则 有 
效 。 因 此 ， 后 续 讨 论 中 不 包含 有 效 位 。 

在 讨论 映射 方案 之 前 ， 有 一 点 非常 重要 。 某 些 计算 机 是 采用 字 节 寻 址 的 ， 还 有 一 些 是 字 寻 
址 的 。 决 定 某 个 映射 方案 是 否 有 效 的 关键 就 是 需要 知道 主 存 、 缓 存 以 及 缓存 块 中 包含 了 多 少 个 
地 址 位 。 如 果 是 用 字 节 寻 址 的 机 器 ， 那 么 我 们 关注 字 节 数 ; 如 果 是 用 字 寻 址 的 机 器 ， 那 么 我 们 
关注 字数 ， 而 不 管 字 的 大 小 。 

直接 映射 

直接 映射 通过 模 的 方式 来 进行 主 存 和 缓存 之 间 的 块 分 配 。 因 为 主 存 的 块 数 比 缓存 的 块 数 
多 ， 因 此 主 存 块 需要 竞争 使 用 缓存 块 。 直 接 映射 将 主 存 块 X 映射 到 缓存 块 Y， 模 为 Y， 其 中 N 
是 缓存 中 包含 的 总 块 数 。 例 如 ， 如 果 缓 存 包 含 4 个 块 ， 则 主 存 块 0 映射 到 缓存 块 0， 主 存 块 1 
映射 到 缓存 块 1， 主 存 块 2 映射 到 缓存 块 2， 主 存 块 3 映射 到 缓存 块 3， 主 存 块 4 映射 到 缓存 块 
0,， 依 次 类 推 ， 如 图 6-2 所 示 。 在 图 6-2a 中 ， 主 存 共 有 8 个 块 ， 而 缓存 共有 4 个 块 ， 因 此 每 两 
个 主 存 块 需要 映射 到 缓存 中 的 同一 块 。 在 图 6-2b 中 ， 主 存 的 16 个 块 映射 到 缓存 的 4 个 块 。 若 
将 主 存 块 数 加 倍 ， 则 映射 到 同一 块 缓存 的 主 存 块 数 也 需要 加 倍 。( 很 快 我 们 会 看 到 这 种 方式 是 
直接 映射 的 一 个 主要 缺点 。) 





a) 8 个 主 存 块 映射 到 4 个 缓存 块 b ) 16 个 主 存 块 映射 到 4 个 缓存 块 
图 6-2 主 存 块 和 缓存 块 之 间 的 直接 映射 


你 可 能 会 疑惑 ， 如 果 主 存 块 0 和 块 4 同时 映射 到 了 缓存 块 0， 那 么 在 任意 给 定时 刻 CPU 怎 
么 才能 知道 缓存 中 的 块 0 到底 是 主 存 块 0 还 是 块 4 呢 ? 答案 就 是 每 一 个 主 存 块 存储 到 缓存 中 
时 ， 都 会 用 标记 字段 进行 标识 。 这 就 意味 着 ， 每 一 个 块 的 标记 都 必须 和 主 存 块 一 样 存放 在 缓存 
中 ， 就 像 接 下 来 我 们 会 看 到 的 一 样 。 





为 了 实现 直接 映射 ， 二 进 制 主 存 地 址 划分 为 多 个 字段 ， 如 图 6-3 所 示 。 

每 一 个 字段 的 大 小 取决 于 主 存 和 缓存 的 物理 
属性 。 偏 移 字 段 识别 块 内 的 字 / 字 节 地 址 ， 因 此 ， 
它 必 须要 包含 合适 的 位 数 。 每 一 个 块 中 的 字 节 数 
(针对 字 节 寻 址 的 计算 机 ) 或 字数 (针对 字 寻 址 的 ”< 一 一 一 主 存 地 址 中 的 二 进 制 位 “一 一 一 > 
计算 机 ) 决 定 了 偏 移 字 段 的 位 数 。 对 块 字段 也 是 如 图 6-3 ”使 用 直接 映射 时 的 主 存 地 址 格式 
此 一 一 必须 能 够 选 出 缓存 中 的 每 一 个 唯一 块 。( 绥 
存 的 总 块 数 决定 了 块 字段 的 位 数 。) 标 记 字 段 就 是 剩 下 的 位 数 。 当 主 存 中 的 一 个 块 拷贝 到 缓存 中 
时 ， 标 记 字 段 也 存储 在 了 缓存 块 中 ， 并 唯一 地 标识 该 块 。 当 然 ， 这 三 块 的 位 数 加 起 来 应 该 等 于 
主 存 地 址 的 位 数 。 接 下 来 我 们 看 几 个 例子 。 

(时 假设 某 按 字 节 寻 址 的 主 存 共有 4 块 ， 缓 存 有 2 块 ， 每 块 是 4 字 节 。 因 此 主 存 的 
块 0 和 块 2 映射 到 缓存 的 块 0， 主 存 的 块 1 和 块 3 映射 到 缓存 的 块 1。( 使 用 模 运 算 很 容易 得 
出 结果 ， 因 为 0 mod 2 =0, 1 mod2=1, 2mod2=0, 3mod2=1。 但 是 计算 机 必须 用 其 主 存 
地 址 来 进行 模 运算 。 ) 使 用 标记 、 块 和 偏 移 字 段 ， 我 们 可 以 看 出 主 存 块 如 何 映射 到 缓存 块 上 ， 
见 图 6-4。 











1 1 和 


下 
标记 。 块 偏 移 
b ) 地 址 0011 划 分 的 字段 

| 
标记 块 偏 移 


d ) 地 址 1010 划 分 的 字段 





主 存 缓存 ”标记 


块 0 


块 1 





块 2 1010 


块 3 
e ) 包含 地 址 1010= 0xA 的 块 的 映射 
图 6-4 例 6.1 的 示意 图 


首先 ， 我 们 需要 确定 用 于 映射 的 地 址 格式 ， 由 于 每 块 大 小 为 4 字 节 ， 因 此 偏 移 字段 必须 包 
含 2 位 。 在 缓存 中 共有 2 块 ， 故 块 字段 是 1 位 ， 还 剩 1 位 就 是 标记 字段 。( 因 为 主 存 共有 2 = 


232 第 6 章 





16 字 节 ， 故 主 存 地 址 有 4 位 。) 格 式 见 图 6-4a。 

假设 需要 访问 的 主 存 地 址 为 0x3( 二 进 制 为 0011) 。 如 果 使 用 图 6-4a 所 示 的 地 址 格式 来 划 
分 0011 ， 就 会 得 到 图 6-4b。 于 是 我 们 知道 主 存 地 址 0011 映射 到 缓存 块 0 中 ( 因为 块 字段 为 0)。 
图 6-4c 给 出 了 映射 结果 ， 标 记 字 段 也 和 数据 一 样 存储 到 了 缓存 块 中 。 

假设 现在 要 访问 主 存 地址 0xAuw = 1010,。， 使 用 相同 的 地 址 格式 ， 我 们 可 以 看 出 它 映射 到 
了 缓存 块 0 中 ( 见 图 6-4d) 。 但 是 ， 如 果 将 主 存 地 址 1010( 标 记 为 1) 的 标记 字段 和 当前 缓存 块 0 
(标记 为 0) 中 的 标记 字段 进行 比较 ， 会 发 现 它们 并 不 匹配 。 因 此 ， 缓 存 块 0 中 的 数据 会 被 删 
除 ， 主 存 块 3 将 取代 缓存 块 0 的 内 容 ， 并 改变 标记 字段 的 内 容 ， 结 果 如 图 6-4e 所 示 。 4 

接 下 来 ,考虑 一 个 主 存 容量 更 大 的 例子 。 

假设 某 个 采用 字 节 寻 址 方式 的 存储 器 容量 为 2* 字 节 ， 缓存 有 16 个 块 ， 每 块 包含 
8 字 节 。 由 此 可 以 推导 出 主 存 共 有 223 =2" 抉 。 而 我 们 又 知道 每 个 主 存 地 址 都 需要 14 位 ， 这 
14 位 地 址 当中 ， 最 右边 ( 即 最 低 )3 位 表示 偏 移 字段 (需要 3 位 来 唯一 地 指定 块 内 8 个 字 节 中 的 
一 个 ) 。 接 下 来 ， 需 要 4 位 来 选择 缓存 中 的 某 个 /他 i ee 


块 ， 因 此 块 字段 需要 占用 地 址 的 中 间 4 位 。 余 下 
偏 移 


的 高 7 位 地 址 组 成 了 标记 字段 。 各 字段 组 成 及 其 
《一 1 全 一 一 一 一 一 


大 小 见 图 6-5。 
如 前 所 述 ， 主 存 块 中 的 标记 字段 存储 在 缓存 
的 相应 块 中 。 在 本 例 中 ， 由 于 主 存 块 0 和 16 均 映 图 65 例 6.2 中 的 主 存 映射 地 址 格式 
射 到 缓存 的 0 块 ， 因 此 标记 字段 会 允许 系统 区 分 块 0 和 块 16。 块 0 和 块 16 的 二 进 制 地 址 在 高 7 
位 是 不 同 的 ， 因 此 标记 字段 是 不 同 的 且 是 唯一 的 。 本 
(人 芭 网 我 们 来 看 一 个 稍微 长 一 点 的 例子 。 假 设 某 按 字 节 寻 址 的 系统 的 主 存 容 量 为 16 字 
节 ， 且 分 成 8 块 (因此 每 块 有 2 字 节 ) ， 它 采用 直接 映射 。 假 设 缓存 包含 4 块 ( 共 8 字 节 )。 图 6-6 
给 出 了 主 存 到 缓存 的 映射 结果 。 我 们 可 以 知道 : 
。 主 存 地 址 共有 4 位 (因为 主 存 容量 为 16 字 节 ) 。 
e 4 位 主 存 地 址 分 为 3 个 字段 : 偏 移 字段 包含 1 位 ( 仅 需 1 位 即 可 区 分 某 块 中 的 两 个 字 ) ; 
块 字段 占 2 位 (因为 缓存 共有 4 个 块 ， 需 要 2 位 来 唯一 地 标识 每 一 个 块 ) ; 标记 字段 占 1 
位 (余下 的 就 1 位 了 ) 。 
主 存 映射 到 缓存 
(000 ) 块 0 (地 址 0x0, 0x1) 一 一 一 一 一 一 一 > 块 0(00) 
(001 ) 块 1 (地 址 0x2,0x3) 一 一 一 一 一 一 一 > 块 1(01) 
(010) 块 2 (地 址 0x4, 0x5 ) 一 一 一 一 > 块 2(10) 
(011》 块 3〈 地 址 0x6 027) 一 -一生 块 3(11) 
(100) : 热 4 《地 二 0x8,0x9) 一 一 一 块 0(00) 
(1017 ' 扫 5 (地 HE0xXAj0xB)】 一 一 一 一 一 > 块 1 (01) 


(110) 块 6 (地 址 0xC,0xD) 一 一 “> 块 2(10) 
(111) 块 7 ( 地址 0xE, 0xF ) 块 3(11) 


图 6-6 主 存 映 射 到 缓存 


图 6-7 给 出 了 划分 为 3 个 字段 的 主 存 地 址 。 

假设 现 有 主 存 地 址 0x9。 从 图 6-6 所 示 的 映射 表 中 可 以 看 出 ， 主 存 块 4 中 的 0x9 应 该 映射 
到 缓存 块 0 中 ( 即 主 存 块 4 中 的 内 容 应 该 拷贝 到 缓存 块 0 中 去 )。 但 是 ,计算 机 使 用 实际 的 主 存 
地 址 来 决定 映射 到 缓存 的 哪个 块 。 主 存 的 二 进 制 地 址 见 图 6-8。 

当 CPU 产生 主 存 地 址 时 ， 它 首先 会 用 块 字段 的 二 进 制 位 00 直接 映射 到 缓存 的 相应 块 。00 表 
示 应 该 去 检查 缓存 的 块 0， 如 果 缓 存 块 有 效 ， 那 么 接 下 来 CPU 会 比较 标记 字段 的 值 ( 主 存 地址 中 ) 
与 缓存 块 0 中 标记 字段 的 值 。 如 果 缓 存 块 0 中 的 标记 也 为 1， 则 主 存 的 块 4 已 经 位 于 缓存 块 0 了 。 
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如 果 缓 存 块 0 中 的 标记 值 为 0， 则 表示 缓存 的 块 0 中 存放 的 是 主 存 的 块 0。( 为 此 ， 可 将 主 存 地 址 
0x9 =1001,( 即 块 4) 和 0xl =0001,( 块 0) 进 行 比较 。 这 两 个 地 址 仅 有 最 高 位 不 同 ， 而 这 一 位 就 是 组 
存 中 标记 字段 的 值 。) 假设 标记 字段 是 匹配 的 ， 这 就 意味 着 主 存 中 的 块 4( 主 存 地 址 为 0x8 和 0x9) 存 
储 在 缓存 的 块 0 中 ， 而 偏 移 字段 中 的 1 就 用 来 选择 块 中 的 两 个 字 节 之 一 。 因 为 此 位 值 为 1， 所 以 
会 选择 偏 移 为 1 的 字 节 ， 即 访问 从 主 存 地 址 0x9 拷贝 过 来 的 数据 。 


Ws Ct 
OO + 


图 6-7 例 6.3 中 的 主 存 地 址 格式 图 6-8 主 存 地 址 9=1001, 划 分 的 字段 


假设 CPU 又 生成 了 一 个 主 存 地 址 0x4 =0100,， 地 址 的 中 间 两 位 (10) 直接 映射 到 缓存 的 块 
2。 如 果 块 2 有 效 ， 则 最 左边 的 标记 位 (0) 将 会 和 缓存 的 块 2 中 的 标记 值 进行 比较 。 如 果 相 同 ， 
则 缓存 块 中 的 第 一 个 字 节 ( 偏 移 为 0) 就 会 返回 给 CPU。 为 了 确认 你 能 理解 此 过 程 ， 请 用 主 存 地 
址 0xC = 1100, 来 进行 一 下 简单 的 练习 。 < 

让 我 们 继续 看 一 个 更 大 的 例子 。 

假设 某 字 节 寻 址 系统 使 用 一 个 16 位 的 主 存 地 址 ， 并 且 缓存 有 64 个 块 ， 如 果 每 块 
包含 8 字 节 ， 则 我 们 知道 主 存 的 16 位 地 址 会 按 如 下 方式 进行 划分 : 偏 移 字段 占 3 位 ， 块 字段 
占 6 位 ， 标 记 字 段 占 7 位 。 如 果 CPU 生成 如 下 主 存 地 址 : 


人 rr， 
”000001 000000 100 
et 


标记 块 偏 移 
那么 CPU 将 会 去 查找 缓存 块 0。 如 果 缓 存 块 0 的 标记 字段 为 0000010， 则 该 块 中 偏 移 为 4 的 字 
节 内 容 将 会 传送 给 CPU 。 到 

综 上 所 述 ， 直 接 映 射 实现 的 就 是 将 主 存 块 按照 模 运 算 的 方式 映射 到 缓存 ， 为 了 确认 此 种 映 
射 方式 能 够 成 功 运行 ， 你 需要 了 解 以 下 几 项 内 容 : 

。 主 存 地 址 共有 多 少 位 (由 主 存 有 多 少 个 地 址 来 决定 ) 

e 缓存 中 共有 多 少 个 块 ( 这 决定 了 块 字段 的 大 小 ) 

。 一 个 块 中 共有 多 少 个 地 址 (这 决定 了 偏 移 字段 的 位 数 ) 

一 旦 知道 了 这 几 个 值 ， 就 可 以 使 用 直接 映射 地 址 格式 来 定位 主 存 中 的 某 个 块 存储 到 缓存 中 
的 哪个 块 了 。 一 旦 找到 缓存 块 ， 就 可 以 通过 标记 字段 来 判断 当前 缓存 块 中 的 内 容 存储 的 是 不 是 
你 要 找 的 主 存 块 中 的 内 容 。 如 果 标 记 字 段 能 够 匹配 ( 主 存 地 址 中 的 标记 值 和 对 应 缓存 块 中 的 标 
记 值 相同 ) ， 就 可 以 使 用 偏 移 字 段 中 的 值 去 缓存 块 中 找到 所 需 数据 。 

全 相 联 映射 

因为 直接 映射 缓存 不 需要 任何 查找 策略 ， 所 以 采用 这 种 方式 的 缓存 不 像 其 他 缓存 那么 昂 
贵 。 每 一 个 主 存 块 在 映射 到 缓存 时 都 有 一 个 特定 的 位 置 。 在 将 主 存 地 址 变换 为 缓存 地 址 时 ， 
CPU 通过 简单 地 检查 块 字段 的 二 进 制 值 就 可 以 精确 地 知道 主 存 块 对 应 的 是 缓存 的 哪 一 块 。 这 和 
通讯 录 相 似 : 页 面 上 通常 会 有 字母 索引 。 如 果 要 查找 “Joe Smith”， 在 “S” 标 签 下 查找 即 可 。 

我 们 可 以 看 一 个 相反 的 方案 ， 它 不 再 给 每 个 主 存 块 指定 唯一 的 地 址 : 允许 每 一 个 主 存 块 存 
放 在 缓存 的 任意 一 块 中 。 那 么 查找 块 映射 的 唯一 途径 就 是 搜索 整个 缓存 。( 这 和 你 的 书桌 的 例 
子 相似 !1) 这 一 方案 需要 整个 缓存 都 由 相 联 存储 器 构成 ， 这 样 才能 实现 并 行 查找 。 也 就 是 说 ， 单 


1 位 
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次 查找 也 必须 将 请 求 块 的 标记 和 缓存 中 所 有 块 的 标记 进行 比较 才能 确定 主 存 块 到 底 存 储 在 哪 一 
个 缓存 块 中 。 相 联 存 储 器 需要 专门 的 硬件 来 进行 相 联 查找 ， 故 价格 很 昂贵 。 

让 我 们 来 详细 地 了 解 一 个 相 联 存储 器 ， 以 更 好 地 理解 为 什么 它 的 价格 那么 昂贵 。 前 面 我 们 
讲 过 ,全 相 联 映射 允许 每 一 个 主 存 块 存在 缓存 中 的 任意 位 置 ， 这 就 意味 着 我 们 不 得 不 搜索 缓存 
来 找到 它 。 为 了 使 搜索 更 高 效 ， 我 们 并 行 查 找 ， 但 在 硬件 上 如 何 实现 ?首先 ， 缓存 中 的 每 一 个 
块 都 必须 有 一 个 比较 电路 ， 如 果 两 个 值 比较 之 后 相同 ， 则 此 电路 的 输出 就 是 1。 同 时 主 存 地 址 
的 标记 字段 会 和 每 一 个 缓存 块 的 标记 进行 比较 ， 如 图 6-9a 所 示 。 这 种 存储 器 之 所 以 价格 昂贵 ， 
不 仅 因 为 查找 到 对 应 的 缓存 块 后 需要 一 系列 的 多 路 复 用 器 来 选取 合适 的 数据 ， 而 且 还 因为 需要 
附加 电路 来 实现 比较 功能 。 图 6-9b 给 出 了 一 个 全 相 联 存储 器 所 需 电路 的 简单 示意 图 。 

主 存 地 址 








a ) 同时 比较 b ) 必要 电路 的 简化 示意 图 
图 6-9 相 联 映射 缓存 


在 使 用 相 联 映射 时 ， 主 存 地 址 划分 为 两 个 部 分 : 标记 字段 和 偏 移 字段 。 回 顾 例 6. 2 可 知 ， 
主 存 容量 为 2“ 字 节 ， 缓 存 共有 16 个 块 ， 并 且 每 块 和 
有 8 字 节 。 若 使 用 全 相 联 映射 而 非 直接 映射 的 话 ， 
在 标记 字段 是 11 位 。 这 里 的 标记 字段 必须 存储 在 
缓存 的 每 一 个 块 中 。 当 在 缓存 中 查找 某 指定 主 存 
块 时 ， 该 主 存 地 址 的 标记 字段 就 会 和 缓存 中 所 有 ”图 6-10 相 联 映射 时 的 主 存 地 址 格式 
有 效 的 标记 字段 进行 比较 。 如 果 找 到 匹配 项 ， 则 表示 找到 了 对 应 的 缓存 块 。( 注意 ， 这 里 的 标 
记 可 以 唯一 地 区 分 主 存 块 。) 如 果 都 不 匹配 ， 则 意味 着 缓存 失效 并 且 所 需 的 块 必须 从 主 存 中 访问 
并 传 给 CPU。 

采用 直接 映射 时 ， 如 果 某 个 块 已 经 占用 了 新 块 欲 使 用 的 缓存 位 置 ， 则 缓存 中 的 当前 块 将 会 
移出 (如 果 有 改动 则 会 写 回 主 存 ， 若 是 未 修改 也 简单 地 重 写 回 主 存 ) 。 在 采用 全 相 联 映射 时 ， 
当 缓存 被 占 满 时 ， 我 们 需要 一 个 替换 算法 来 决定 到 底 将 缓存 中 的 哪 一 个 块 抛弃 ( 这 个 块 叫 作 淘 
汰 块 )。 可 以 使 用 简单 的 先进 先 出 算法 ， 也 可 以 用 最 近 最 少 使 用 算法 。 替 换算 法 有 很 多 ， 这 部 
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分 内 容 将 在 6. 4. 2 节 中 讨论 。 

因此 概括 地 说 ， 全 相 联 映射 允许 主 存 的 每 一 个 块 映射 到 缓存 的 任意 一 个 块 中 。 一 旦 主 存 块 
存放 到 了 缓存 中 ， 为 了 找到 某 一 指定 字 节 中 的 内 容 ， 计 算 机 需要 将 主 存 地 址 的 标记 字段 和 缓存 
中 所 有 的 标记 字段 同时 进行 比较 (一 次 完成 比较 )， 一旦 找到 对 应 的 缓存 块 ， 就 用 偏 移 字 段 来 
定位 该 块 内 的 所 需 数据 。 如 果 主 存 地 址 的 标记 字段 在 缓存 块 中 找 不 到 能 与 之 匹配 的 标记 字段 ， 
那么 包含 所 需 数据 的 主 存 块 就 会 传送 给 缓存 。 这 可 能 需要 从 缓存 中 淘汰 掉 一 个 块 。 

组 相 联 映 射 

由 于 相 联 存储 器 的 速度 和 复杂 性 ， 它 的 成 本 非常 高 。 虽 然 直接 映射 成 本 不 高 ， 但 它 过 于 死 
板 。 为 了 说 明 直 接 映射 的 局 限 性 ， 假 设 在 例 6. 3 给 定 的 体系 结构 上 运行 一 个 程序 。 假 设 该 程序 在 
执行 指令 时 依次 调用 块 0、4、0、4,， 重复 循环 。 由 于 块 0 和 块 4 会 映射 到 缓存 的 相同 位 置 上 ， 这 
就 意味 着 需要 重复 地 调 出 块 0 以 便 调 入 块 4， 紧 接着 又 调 出 块 4 以 便 把 块 0 调 信 ， 即 使 在 缓存 中 
还 有 空余 块 未 被 使 用 。 全 相 联 映射 弥补 了 这 个 不 足 ， 因 为 它 允 许 主 存 块 放 人 缓存 中 的 任意 位 置 。 
但 是 ， 这 种 方式 需要 在 缓存 中 存储 一 个 长 度 非常 大 的 标记 字段 (需要 很 大 的 缓存 ) ， 并 需要 额外 的 
专门 硬件 来 同时 查找 缓存 中 的 所 有 块 (这 意味 着 更 贵 的 缓存 ) ， 故 需要 一 种 折 中 方案 。 

我 们 介绍 的 第 三 种 方案 就 是 N 路 组 相 联 映射 ， 它 是 前 两 种 方法 的 一 种 组 合 形式 。 这 种 方案 
中 ,使 用 地 址 将 主 存 块 映射 到 特定 的 缓存 块 上 ， 这 一 点 和 直接 映射 相似 。 最 重要 的 区 别 在 于 它 
不 是 让 主 存 地 址 映射 到 单一 的 缓存 块 上 ， 而 是 映射 到 由 几 个 缓存 块 组 成 的 一 组 上 。 在 缓存 中 所 
有 组 的 大 小 都 是 相同 的 。 不 同 缓存 的 组 的 大 小 可 以 不 同 。 比 如 , 在 2 路 组 相 联 映射 缓存 中 ， 每 
一 组 有 2 个 缓存 块 ， 见 图 6-11。 在 逻辑 视图 上 极 易 将 其 看 作 一 个 二 维 缓存 。 在 图 6-11a 中 ， 我 
们 看 到 了 2 路 组 相 联 映射 ,每 一 组 有 2 个 块 ， 因 此 此 缓存 既 有 行 又 有 列 。 但 是 ， 高 速 缓存 实际 
上 是 线性 的 。 从 图 6-11b 中 可 以 看 到 组 相 联 映射 的 缓存 就 是 由 线性 存储 器 实现 的 。4 路 组 相 联 
映射 缓存 的 每 组 有 4 个 块 ，8 路 组 相 联 映射 缓存 的 每 组 有 8 个 块 ， 依 次 类 推 。 一 旦 定位 到 所 需 
的 组 以 后 ， 缓 存 就 可 以 被 看 作 组 相 联 存储 器 了 ， 主 存 地 址 的 标记 字段 就 可 以 用 来 和 缓存 组 内 的 
各 个 标记 字段 进行 比较 。 组 相 联 映射 仅 需要 对 每 一 组 有 一 个 比较 器 ， 而 不 是 对 缓存 中 的 每 一 个 
块 用 一 个 比较 电路 。 例 如 ， 如 果 总 共有 64 个 缓存 块 ， 且 使 用 4 路 组 相 联 映射 ， 则 仅 需 要 4 个 
比较 器 ， 而 不 是 64 个 。 当 N 路 组 相 联 映射 的 组 大 小 为 1 时 ， 就 变 为 直接 映射 。( 直接 映射 是 组 
相 联 映射 在 组 大 小 为 1 时 的 特例 。) 当 缓 存 有 nn 块 时 ,全 相 联 映射 就 是 组 相 联 映射 在 组 大 小 为 n 
时 的 特例 。 


组 0 


组 2 





a ) 2 路 组 相 联 映射 的 逻辑 视图 b ) 2 路 组 相 联 映射 的 线性 视图 
图 6-11 一 个 2 路 组 相 联 映射 





在 组 相 联 映 射 中 ， 主 存 地 址 分 成 3 部 分 : 标记 字段 、 组 字段 、 偏 移 字段 。 标 记 字 段 和 偏 移 字 
站 

假设 某 主 存 采 用 字 节 寻 址 方式 ， 容 量 为 22 字 节 ， 它 采用 2 路 组 相 联 映射 ， 缓 存 共 
人 每 块 有 8 字 节 。 如 果 缓 存 总 共 包 含 16 个 块 ， 并 且 每 组 有 2 个 块 ， 则 共有 8 组 。 因 
此 ， 组 字段 为 3 位 ， 偏 移 字段 为 3 位 ， we 8 位 3 位 3 位 
为 8 位。 如 图 6-12 所 示 。 和 

dh 
指定 了 唯一 的 一 组 ， 会 对 该 组 中 所 有 的 块 进行 搜 
索 来 确认 是 否 和 给 定 主 存 块 的 标记 字段 相 匹配 。 
这 就 必须 要 实现 组 相 联 搜索 ， 但 搜索 会 严格 限制 
在 特定 组 而 非 整个 缓存 ， 这 大 幅 降低 了 专 有 硬件 的 成 本 。 比 如 ,在 2 路 组 相 联 映射 中 ， 只 需要 
并 行 搜索 2 个 块 即 可 。 

接 下 来 我 们 看 一 个 例子 ， 它 描述 了 各 种 映射 方案 之 间 的 区 别 。 

某 主 存 采用 字 节 寻 址 方式 ， 容 量 为 1MB。 缓 存 共 有 32 个 块 ， 每 块 有 16 字 节 。 当 
分 别 采用 直接 映射 、 全 相 联 映射 和 4 路 组 相 联 映射 时 ， 试 分 析 主 存 地 址 0x326A0 映射 到 缓存 的 
哪 一 块 或 哪 一 组 。 

首先 ， 我 们 注意 主 存 地 址 共有 20 位 。 当 采用 直接 映射 时 ， 主 存 地 址 格式 如 图 6-13 所 示 。 

如 果 采 用 二 进 制 表示 主 存 地 址 0x326A0 并 且 也 分 解 为 上 述 地 址 格式 ， 则 将 会 得 到 图 6-14 
所 示 的 字段 。 





ee eR 14 位 一 一 一 > 
图 6-12 例 6.5 所 示 的 组 相 联 映射 的 格式 





11 位 5 位 4 位 11 位 5 位 4 位 
OO 一 二- 一 20 位 一 一 
图 6-13 例 6.6 中 采用 直接 映射 的 地 址 格式 图 6-14 例 6.6 中 的 地 址 0x326A0 在 直接 映射 中 
划分 的 字段 


从 图 中 可 以 看 出 ， 主 存 地 址 0x326A0 将 会 映射 到 缓存 的 01010 块 ( 或 十 进 制 的 块 10)。 

如 果 采 用 全 相 联 映射 ， 主 存 地 址 格式 如 图 6-15 所 示 。 

但 是 ,将 主 存 地 址 分 解 为 字段 格式 并 不 能 帮助 我 们 理解 该 主 存 块 到 底 映 射 到 缓存 的 哪 一 个 
块 上 ， 因 为 在 全 相 联 映射 中 这 个 块 可 以 映射 到 缓存 的 任意 块 上 。 如 果 使 用 4 路 组 相 联 映射 ， 主 
存 地 址 格式 如 图 6-16 所 示 。 


16 位 4 位 13 位 3 位 4 位 





0 = < 一 一 一 20 位 一 一 > 
图 6-15 例 6.6 中 采用 全 相 联 映射 的 地 址 图 6-16 例 6.6 中 采用 4 路 组 相 联 映射 的 地 
格式 址 格式 


组 字段 有 3 位 ， 因 为 缓存 中 仅 有 8 组 (每 组 4 块 )。 将 给 定 内 存 地 址 按 字段 分 解 ， 如 图 6-17 
所 示 。 
13 位 3 位 4 位 


0011001001101 En 0000 


OG 
图 6-17 例 6.6 中 的 地 址 0x326A0 在 组 相 联 映射 中 划分 的 字段 
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也 就 是 说 ， 主 存 地 址 0x326A0 会 映射 到 缓存 组 010, =2 中 。 但 是 还 要 继续 查找 这 一 组 的 内 容 
(通过 比较 给 定 地 址 和 缓存 组 2 中 的 所 有 标记 字段 ) ， 才 有 可 能 找到 所 需 数 据 。 4 

我 们 再 看 例子 来 加 强 对 缓存 映射 概念 的 理解 。 

假设 某 字 节 寻 址 计算 机 的 缓存 共有 8 个 块 ， 每 块 有 4 字 节 。 知 每 个 主 存 地 址 均 为 
8 位 ， 缓 存 初始 为 空 ， 那 么 针对 每 一 种 缓存 映射 方案 ( 即 直接 映射 、 全 相 联 映射 和 2 路 组 相 联 
映射 ) ， 当 程序 依次 访问 内 存 地 址 0x01 、0x04 、0x09 、0x05 、0x14 、0x21 和 0x01 时 ， 试 跟踪 组 
存 的 占用 情况 。 

我 们 先 从 直接 映射 开始 。 首 先 ， 要 确定 地 址 格式 。 由 于 每 块 包含 4 字 节 ， 因 此 偏 移 字 段 需 
要 2 位 。 缓 存 总 共有 8 个 块 ， 因 此 块 字段 需要 3 位 。 内 存 地 址 共 8 位 ， 因 此 剩 下 的 3 位 为 标记 
字段 。 结 果 如 下 : 

3 位 3 位 2 位 
标记 块 偏 移 
< 一 一 一 一 一 一 一 
现在 地 址 格式 已 知 ， 那 么 我 们 就 可 以 跟踪 程序 了 。 

















“二进制 地 址 2 
访问 地 址 (分 解 为 3 个 字段 ) 命中 或 失效 说 明 
当 标 记 字 段 为 000 时 ， 检 查 缓存 块 000， 发 现 缺失 ， 因 此 将 地 址 
0x01 000 000 01 失效 0x00 、0x01 、0x02 和 0x03 中 的 数据 拷贝 到 缓存 块 0， 并 在 该 块 存储 
标记 000 
当 标记 字段 为 000 时 ,检查 缓存 块 001， 发 现 缺失 ， 因 此 将 地 址 
Ox04 000 001 00 失效 0x04 、0x05 、0x06 和 0x07 中 的 数据 拷贝 到 缓存 块 1， 并 将 标记 000 
] 存储 在 该 缓存 块 内 
当 标记 字段 为 000 时 ， 检 查 缓存 块 010(2) ， 发 现 缺失 ， 因 此 将 地 
0x09 000 010 01 失效 址 0x08、0x09、0x0A 和 0x0B 中 的 数据 拷贝 到 缓存 块 2， 并 在 该 块 
存储 标记 000 
Oe OO OLD 命中 当 标 记 字段 为 000 时 ， 检 查 缓存 块 001， 结 果 匹 配 。 接 下 来 偏 移 


地 址 01 中 的 数据 即 为 需要 的 值 


当 标记 字段 为 000 时 ， 检 查 缓存 块 101(5) ， 但 结果 不 匹配 。 因 此 
0xl4 000 101 00 失效 将 地 址 0x14 、0x15 、0x16 和 0x17 中 的 数据 拷贝 到 缓存 块 5， 并 将 标 


记 000 存储 在 该 块 中 
当 标记 字段 为 001 时 ,检查 缓存 块 000， 继 而 发 现 该 块 的 标记 字 
段 为 000( 表 示 该 块 内 容 不 是 要 查找 的 块 ) ， 因 此 通过 把 地 址 0x20 、 
0x21 、0x22 、0x23 中 的 数据 拷贝 到 缓存 块 0 来 重 写 该 缓存 的 内 容 ， 
并 将 标记 001 存储 在 该 块 中 


尽管 先前 我 们 已 将 包含 地 址 0x01 的 主 存 块 调 入 缓存 块 0， 但 它 已 
经 被 包含 地 址 0x21 的 主 存 块 所 覆盖 或 者 说 重 写 。( 如 果 检 查 缓 存 块 
0x01 000 000 01 失效 0， 则 会 发 现 其 标记 字段 为 001， 而 非 000.) 因此 ， 必 须 用 地 址 
0x00 、0x01 、0x02 及 0x03 中 的 数据 再 次 重 写 缓存 块 0 的 内 容 ， 并 将 
标记 000 存储 在 该 块 中 























有 几 点 需要 注意 : 当 发 生 缓存 失效 时 ， 我 们 总 是 将 整个 主 存 块 拷贝 到 缓存 中 ， 并 不 是 从 缺 
失地 址 开始 拷贝 4 字 节 ， 而 是 用 包括 缺失 地 址 在 内 的 4 字 节 内 存 块 来 重 写 缓存 。 例 如 ， 当 内 存 
从 地 址 0x09 访问 失效 时 ， 将 传送 从 地 址 0x08 开始 的 4 字 节 数据 。 因 为 0x09 在 该 块 内 的 偏 移 地 
址 为 1， 所 以 该 块 的 起 始 地 址 为 0x08。 还 需要 注意 缓存 块 0 中 的 内 容 ， 对 直接 映射 来 说 ， 这 是 
一 个 典型 的 问题 。 缓 存 的 最 终 内 容 是 : 
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缓存 内 容 ( 用 地 址 表示 ) 

0x00，0x01，0x02，0x03 000 
国医 0x04，0x05，0x06，0x07 000 

0x08, 0x09，0x0A，0x0B 000 











Ox14, Ox15, Ox16, Ox17 000 


| 于 地 一 二 = 六 


当 采 用 全 相 联 映射 时 ， 情 况 会 如 何 变化 呢 ? 首先 ， 地 址 格式 会 变 为 : 
6 位 4 位 


OO 一 一 














-|=|“|*|elel-|= 医 








在 采用 全 相 联 映 射 时 ， 主 存 块 将 存储 到 缓存 的 任意 位 置 。 假 设 我 们 将 主 存 块 存 人 缓存 中 的 
第 一 个 可 用 位 置 ; 若 所 有 位 置 都 满 了 ， 则 “滚动 ”到 初始 位 置 并 重新 开始 。 












FU - 











当 标记 字段 为 000000 时 ， 检 查 所 有 的 缓存 块 ， 均 未 找到 。 因 此 

0x01 000000 01 失效 将 地 址 0x00 、0x01 、0x02 和 0x03 中 的 数据 拷贝 到 缓存 块 0， 并 在 该 
疗 ' 加 块 内 存储 标记 000000 

当 标 记 字 段 为 000001 时 ， 检 查 所 有 缓存 块 ， 发 现 缺失 。 因 此 将 

0x04 000001 00 失效 地 址 0x04 、0x05 、0x06 和 0x07 中 的 数据 拷贝 到 缓存 块 1， 并 将 标记 


000001 存储 在 该 缓存 块 内 
在 缓存 中 未 找到 标记 字段 为 000010 的 块 ， 因 此 将 地 址 0x08 、 











we 000010 0 失效 。 | 0x09、0x0A 和 0x0B 中 的 数据 拷贝 到 缓存 块 2， 并 在 该 块 存储 标 
记 000010 
0x05 000001 01 命中 当 标记 字段 为 000001 时 ， 检 查 所 有 缓存 块 ， 发 现 它 存储 在 缓存 


块 1 中 ， 接 着 用 偏 移 地 址 01 找到 所 需要 的 数据 


当 标 记 字 段 为 000101 时 ， 检 查 所 有 的 缓存 块 ， 均 未 找到 。 因 此 
Ox14 000101 00 失效 将 地 址 0x14、0x15、0x16 和 0x17 中 的 数据 拷贝 到 缓存 块 3， 并 将 标 
记 000101 存储 在 该 块 中 

当 标 记 字段 为 001000 时 ， 检 查 所 有 的 缓存 块 ， 均 未 找到 。 因 此 
失效 将 地 址 0x20、0x21 、0x22 、0x23 中 的 数据 拷贝 到 缓存 块 4， 并 将 标 
记 001000 存储 在 该 缓存 块 内 

当 标记 字段 为 000000 时 ， 检 查 所 有 缓存 块 ， 发 现 它 存储 在 缓存 
块 0， 接 着 用 偏 移 地 址 01 找到 所 需要 的 数据 





























命中 
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现在 我 们 看 一 下 使 用 2 路 组 相 联 的 情形 。 因 为 缓存 中 有 8 个 块 ， 并 且 每 组 包含 2 个 块 ， 故 
缓存 共有 4 组 。2 路 组 相 联 的 地 址 格式 为 : 


如 果 根 据 对 内 存 的 访问 顺 





4 位 
标记 


2 位 2 位 


< 一 
序 来 跟踪 ， 将 得 到 如 下 结果 : 


说明 





查找 缓存 的 0 组 ， 看 哪 块 的 标记 字段 为 0000， 但 未 找到 。 因 此 将 
地 址 0x00、0x01 、0x02 和 0x03 中 的 数据 拷贝 到 缓存 组 0( 现在 组 0 
有 一 块 被 占用 ， 另 一 块 为 空 ) ， 并 将 标记 0000 存储 在 该 缓存 块 内 。 
使 用 哪 组 无 所 谓 ， 但 为 了 一 致 性 ， 我 们 将 数据 存放 到 第 一 组 中 





检查 缓存 组 1 内 的 各 块 ， 看 是 否 有 标记 字段 为 0000， 发 现 缺失 。 
因此 将 地 址 0x04 、0x05 、0x06 和 0x07 中 的 数据 拷贝 到 缓存 组 1 的 
第 一 块 ， 并 将 标记 0000 存储 在 该 缓存 块 内 





0x09 


0000 10 01 


失效 


检查 缓存 组 2 内 的 各 块 ， 看 是 否 有 标记 字段 为 0000， 发现 缺失 。 
因此 将 地 址 0x08 、0x09 、0x0A 、0x0B 中 的 数据 拷贝 到 缓存 组 2 的 第 
一 块 ， 并 将 标记 0000 存储 在 该 缓存 块 内 





0x05 


0000 01 01 


命中 


检查 缓存 组 1 内 的 各 块 ， 看 是 否 有 标记 字段 为 0000， 发 现 有 ， 接 
着 用 偏 移 地 址 01 定位 到 准确 的 字 节 





Oxl4 


0001 01 00 


检查 缓存 组 1 内 的 各 块 ， 看 是 否 有 标记 字段 为 0001， 发 现 缺 失 。 
因此 将 地 址 0x14 、0x15 、0x16 和 0x17 中 的 数据 拷贝 到 缓存 组 1 的 
第 一 块 ， 并 将 标记 0001 存储 在 该 块 内 。 注 意 : 组 1 现在 是 满 的 





0x21 


0010 00 01 


失效 


检查 缓存 组 0 内 的 各 块 ， 看 是 否 有 标记 字段 为 0010， 发 现 缺 失 。 
因此 将 地 址 0x20、0x21 、0x22 、0x23 中 的 数据 拷贝 到 组 0 的 第 二 
块 ， 并 将 标记 0010 存储 在 该 缓存 块 内 。 注 意 : 组 0 现在 是 满 的 





0x01 





0000 00 01 





缓存 中 的 最 终结 果 为 : 





块 号 
第 一 个 
第 二 个 


命中 





检查 缓存 组 0 中 的 各 块 ， 看 是 否 有 标记 字段 为 0000， 发 现 有 ， 接 
着 用 偏 移 地 址 01 找到 需要 的 数据 


缓存 内 容 ( 用 地 址 表示 ) 
0x00 ，0x01 ，0x02 ，0x03 0000 
0x20 ，0x21，0x22 ，0x23 0001 











0Ox04 ， 


0x05 ，0x06 ，0x07 





0x14， 


Oxl15, Ox16, Ox17 





0x08 ， 


0x09, Ox0A, 0x0B 























a 


组 相 联 映射 是 直接 映射 和 全 相 联 映射 之 间 的 一 个 好 的 折 中 方案 。 研 究 发 现 它 性 能 优良 ， 而 
且 2 路 到 16 路 缓存 的 性 能 接近 于 全 相 联 映射 ， 但 成 本 却 只 有 全 相 联 映射 的 一 小 部 分 。 因 此 ， 
大 多 数 现代 计算 机 系统 都 使 用 某 种 形式 的 组 相 联 映射 方案 ， 最 常见 的 是 4 路 组 相 联 映射 。 





6. 4.2 替换 策略 

在 直接 映射 方案 中 ， 如 果 某 一 缓存 块 有 竞争 现象 ， 则 仅 有 一 种 可 能 : 当前 块 淘汰 出 缓存 给 
新 块 让 地 方 ， 这 个 过 程 叫 作 替换 。 当 采用 直接 映射 方式 时 ， 因 为 新 块 的 位 置 是 预先 设 定好 的 ， 
因此 无 须 替 换 策略 。 但 是 在 全 相 联 映射 和 组 相 联 映射 中 ， 就 需要 有 替换 算法 来 决定 从 缓存 中 移 
出 的 “淘汰 ” 块 。 当 使 用 全 相 联 映射 时 ， 有 个 可 选择 的 缓存 位 置 (kK 为 缓存 中 块 的 总 个 数 ) 
来 让 某 主 存 块 进行 映射 。 当 采用 入 路 组 相 联 映射 时 ， 一 个 主 存 块 可 以 选择 的 映射 位 置 可 以 是 给 
定 组 内 的 个 不 同 块 。 那 么 如 何 决定 到 底 哪 一 个 块 应 该 被 替换 出 去 呢 ? 决定 替换 的 算法 就 叫 作 
替换 策略 。 

有 几 种 常用 的 替换 策略 。 一 种 虽 不 实用 但 能 用 作 基 准 来 衡量 其 他 算法 的 好 坏 ， 即 最 优化 算 
法 。 人 们 总 是 喜欢 把 将 来 就 用 到 的 数值 继续 保留 在 缓存 中 ， 并 扔 掉 那 些 再 也 不 需要 的 块 ， 或 短 
时 不 需要 的 块 。 基 于 上 述 两 个 标准 ， 能 够 预见 未 来 并 能 正确 决定 某 个 块 去 留 的 算法 就 是 最 好 的 
算法 ， 这 也 正 是 最 优化 算法 所 能 做 到 的 。 我 们 想 替 换 掉 的 是 在 将 来 最 长 时 间 内 不 使 用 的 块 。 比 
如 说 ， 在 块 0 和 块 1 中 选择 淘汰 块 ， 块 0 在 $s 内 会 再 次 使 用 ， 而 块 1 在 未 来 的 10s 内 都 不 会 使 
用 ， 那 么 我 们 就 会 把 块 1 淘汰 出 去 。 从 实用 角度 来 看 ， 我 们 无 法 洞 穿 将 来 一 一 但 是 我 们 运行 一 
个 程序 并 且 再 次 运行 它 ， 事 实 上 这 样 就 可 以 知晓 未 来 。 在 第 二 次 执行 程序 时 ， 就 可 以 应 用 最 优 
化 算法 。 最 优化 算法 能 保证 有 最 低 的 失效 率 。 因 为 不 可 能 对 每 个 运行 的 程序 都 能 看 到 未 来 发 生 
的 情况 ， 所 以 最 优化 算法 仅 能 作为 判断 其 他 算法 优 劣 的 一 个 标准 ， 越 接近 此 算法 的 算法 ， 就 
越 好 。 

我 们 需要 最 接近 最 优化 算法 的 方法 ， 这 里 有 几 种 选择 。 例 如 ， 我 们 可 以 考虑 时 间 局 限 性 。 
我 们 可 以 猜测 任何 最 近 未 使 用 的 值 在 将 来 也 不 太 可 能 会 被 调用 。 我 们 可 以 跟踪 每 一 个 块 最 后 一 
次 被 访问 的 时 间 ( 给 该 块 打 一 个 时 间 戳 ) 并 选择 淘汰 最 近 最 少 使 用 的 块 ， 这 就 叫 最 近 最 少 使 用 
(LRU) 算 法 。 但 不 幸 的 是 ，LRU 需要 系统 记录 每 一 个 缓存 块 的 访问 历史 ， 这 需要 占用 大 量 的 
空间 并 降低 了 缓存 的 处 理 速 度 。 有 一 些 方法 接近 于 LRU， 但 超出 了 本 书 的 讨论 范围 (请 看 本 书 
末尾 的 参考 文献 来 获取 更 多 信息 ) 。 

先进 先 出 ( FIFO ) 是 另 一 种 常见 的 算法 ， 在 使 用 这 种 算法 时 ， 在 缓存 中 存在 时 间 最 长 的 块 
(忽略 最 近 它 是 使 用 的 ) 将 会 作为 淘汰 块 从 缓存 中 移 除 。 

还 有 另 一 种 方法 ， 就 是 随机 选择 淘汰 块 。LRU 和 FIFO 的 问题 是 存在 一 些 可 能 会 导致 颠 繁 
的 恶化 访问 情形 (经 常 是 刚 移出 某 块 ， 紧 接着 又 调 入 该 块 ， 然 后 又 移出 ， 又 再 次 调 入 ， 如 此 往 
复 )。 一 些 人 认为 随机 蔡 换算 法 虽然 有 时 移出 了 那些 将 要 很 快 被 访问 的 数据 ,但 它 永 远 不 会 使 
系统 颠 得 。 不 幸 的 是 ， 很 难 实现 真正 的 随机 奉 换 ， 而 且 它 会 降低 平均 性 能 。 

选择 哪 种 替换 算法 往往 取决 于 如 何 使 用 系统 ， 没 有 一 种 (实用 ) 算 法 可 以 适用 于 所 有 场合 。 
鉴于 此 ， 设 计 者 使 用 的 是 那些 在 大 多 数 情况 下 都 表现 良好 的 算法 。 


6. 4. 3 ”有效 访问 时 间 和 命中 率 

分 层 存储 器 的 性 能 可 用 有 效 访 问 时 间 ( EAT ) 或 每 次 访问 的 平均 时 间 来 衡量 。EAT 是 一 种 加 
权 平 均 ， 它 是 用 命中 率 以 及 连续 分 层 存储 器 的 相关 访问 时 间 来 得 出 的 ， 每 一 级 的 实际 访问 时 间 
取决 于 访问 时 所 用 的 技术 及 方法 。 

在 计算 平均 访问 时 间 之 前 ， 我 们 需要 了 解 一 些 缓存 和 内 存 如 何 协同 工作 的 知识 。 当 需要 从 
缓存 中 读 取 数据 时 ， 有 两 种 方法 可 以 获取 数据 。 我 们 可 以 启动 对 缓存 的 访问 ， 同 时 也 启动 对 主 
存 的 访问 (并 行 )。 如 果 数 据 在 缓存 中 找到 了 ， 那 么 就 终止 对 主 存 的 访问 ， 此 时 并 没有 产生 对 
主 存 的 实际 开销 ， 因 为 访问 在 时 间 上 是 重 全 的。 如 果 数 据 不 在 缓存 中 ， 则 继续 对 主 存 的 访问 。 
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当 缓 存 失 效 时 ， 这 种 重 释 访问 有 助 于 减 小 开销 (时 间 上 )。 男 一 种 方法 是 按 顺 序 执行 。 首先， 
查找 缓存 ， 如 果 找 到 了 所 需 数据 ， 那 么 就 结束 访问 过 程 ; 如 果 缓 存 中 未 找到 它 ， 则 开始 访问 主 
存 来 查找 数据 。 这 种 方法 会 影响 平均 访问 时 间 ， 如 下 文 所 述 。 
例如 ， 假 设 缓存 访问 时 间 为 10ns， 主 存 访 问 时 间 为 200ns， 缓 存 的 命中 率 为 99% 。 使 用 重 
瑟 ( 并 行 ) 访 问 方法 ,处 理 器 在 这 个 两 级 存储 器 中 的 平均 访问 时 间 为 : 
下 忆 二 2 on + 0. ng = 9.9ns +2ns = 11. 9ns 
使 用 非 重 全 ( 顺 序 ) 访 问 ,平均 访问 时 间 变 为 : 
检 坦 组 存 到 主 存 去 取 
EAT =.0.99 x 10ns + 0.01 x (Jons + 200ns) = ne ng 
颖 存 命中 缓存 失效 
这 究竟 意味 着 什么 ”如 果 长 时 间 观 察 访 问 时 间 ， 则 系统 好 像 有 了 一 个 访问 时 间 为 11. 9ns 或 者 
12ns 的 大 容量 存储 器 一 样 。99% 的 缓存 命中 率 使 系统 性 能 优异 ， 尽 管 在 此 系统 中 很 多 大 容量 的 
存储 器 是 由 访问 时 间 为 200ns 的 慢 速 技术 构成 的 。 
对 一 个 包含 缓存 和 主 存 的 两 级 存储 器 来 说 ， 计 算 有 效 访问 时 间 的 公式 如 下 所 示 : 
EAT =H x Accessc + (1 - H) x Accessww 
其 中 ,有 为 缓存 命中 率 ，Accessc 为 缓存 访问 时 间 ，Accessww 为 主 存 访问 时 间 。 
这 个 公式 可 推广 到 三 级 或 四 级 存储 结构 中 ， 这 在 后 面 很 快 就 会 看 到 。 


6. 4.4 发 生 缓存 失效 的 时 间 


当 程 序 展现 出 良好 的 局 部 性 时 ,缓存 技 术 也 运行 得 十 分 好 。 但 是 当 程序 出 现 糟糕 的 局 部 性 
时 ,缓存 过 程 就 会 失效 ， 并 且 存 储 器 层次 结构 的 性 能 也 表现 很 差 。 尤 其 是 面向 对 象 的 编程 会 使 
程序 的 局 部 性 达 不 到 最 佳 状态 。 另 一 个 局 部 性 很 差 的 例子 是 二 维 数组 的 访问 。 数 组 一 般 都 是 使 
用 行 优先 存储 的 。 假 设 为 了 达到 本 例 的 目的 ， 数 组 的 一 行 正 好 占用 缓存 的 一 块 ， 除 了 一 行 之 
外 ， 其 余 行 都 能 装 进 缓存 中 。 再 假设 缓存 采用 先进 先 出 蔡 换 算法 ， 如 果 在 某 一 时 刻 ， 程 序 访问 
数组 的 一 行 ， 访 问 第 一 行 时 会 产生 失效 ， 但 是 一 旦 第 一 行 所 在 的 块 被 传送 到 缓存 ， 接 下 来 对 该 
行 数据 的 所 有 访问 都 会 命中 。 因 此 对 于 一 个 5 x4 的 数组 ， 在 20 次 访问 中 (假设 每 次 访问 数组 
的 一 个 元 素 ), 会 有 5 次 失效 和 15 次 命中 。 如 果 程 序 是 以 列 优先 方式 访问 数组 的 ， 则 首次 访问 
位 于 (1，1) 处 的 列 元 素 ， 就 会 产生 失效 ， 在 此 之 后 ， 整 行 都 会 被 调和 人 缓存 中 。 但 是 在 对 列 的 位 
置 (2，1 ) 进行 第 二 次 访问 时 ， 也 会 导致 一 次 失效 ， 对 位 置 (3，1) 的 访问 也 产生 失效 ， 同 理 ， 
对 于 位 置 (4，1) 的 访问 也 失效 。 读 取 位 置 (5，1) 上 的 元 素 时 ， 同 样 也 会 产生 失效 ,但 这 时 会 
将 第 一 行 数据 从 缓存 中 移出 ， 而 把 第 五 行 数据 读 入 到 该 块 的 位 置 。 由 于 刚刚 把 第 一 行 数据 移出 
缓存 ， 所 以 对 于 元 素 (1，2) 的 访问 也 会 引起 失效 。 这 种 失效 会 发 生 在 访问 数组 的 整个 过 程 中 ， 
调和 人 到 缓存 的 每 一 行 数据 接 下 来 都 不 会 用 到 ， 原 因 就 是 数组 是 按 列 访问 的 。 因 为 缓存 空间 不 够 
大 ， 所 以 会 产生 20 次 访问 20 次 失效 的 情况 。 第 三 个 例子 是 程序 对 一 个 在 缓存 中 装 不 下 的 线性 
数组 进行 循环 ， 当 以 这 种 方式 使 用 存储 器 时 ， 局 部 性 会 显著 降低 。 


6.4.5 缓存 写 策略 


除了 决定 选择 哪 一 块 作为 淘汰 块 以 外 ， 设 计 者 还 必须 对 缓存 中 所 谓 的 脏 块 ， 或 者 修改 过 的 
块 进行 处 理 。 当 处 理 器 写 主 存 时 ， 也 要 写 到 缓存 ， 这 是 假设 处 理 器 会 很 快 再 次 访问 它 。 如 果 修 
改 了 某 一 个 缓存 块 中 的 内 容 ， 当 实际 主 存 块 更 新 时 ,缓存 的 写 策略 就 要 保证 缓存 块 中 的 内 容 一 
致 。 有 两 种 基本 的 写 策略 : 

写 直通 一 一 对 每 一 次 写 操作 ， 写 直通 都 同时 更 新 缓存 和 主 存 。 虽 然 速度 比 写 回 策略 慢 ， 但 
它 可 以 保证 缓存 中 的 内 容 和 对 应 主 存 中 的 内 容 是 一 致 的 。 明 显 的 缺点 是 每 一 次 写 操作 都 要 访问 


242 第 6 章 





主 存 。 使 用 这 种 方法 意味 着 每 一 次 写 缓存 都 不 得 不 写 一 次 主 存 ， 因 此 系统 速度 慢 ( 如 果 所 有 访 
存 都 是 写 操作 ， 则 系统 会 降 到 和 主 存 一 个 速度 )。 但 是 ， 在 实际 应 用 中 ， 大 部 分 都 是 读 操作 ， 
故 这 种 减速 可 忽略 不 计 。 

写 回 一 一 写 回 策略 (也 称 回 找 ) 是 仅 当 某 个 缓存 块 被 替换 出 去 时 才 更 新 其 对 应 的 主 存 块 。 
它 的 速度 通常 都 比 写 直通 快 ， 因 为 它 不 是 在 每 一 次 写 缓存 时 都 要 写 主 存 ， 也 减少 了 主 存 传输 。 
缺点 是 某 一 时 刻 主 存 和 缓存 的 对 应 值 可 能 不 同 ， 而 且 如 果 程 序 在 写 回 主 存 之 前 终止 (崩溃 ) 了 ， 
缓存 中 更 新 过 的 数据 会 丢失 。 

为 了 提高 缓存 性 能 ， 一 是 必须 提高 命中 率 ， 这 可 以 使 用 性 能 好 的 映射 算法 (能 提升 大 约 
20% 的 命中 率 ) 、 好 的 写 策 略 ( 大约 提高 15% ) 、 好 的 替换 算法 (提升 大 约 10% ) 以 及 良好 的 编 
码 习惯 ， 就 像 在 先前 例子 中 提 到 的 行 优先 或 列 优先 访问 (大 约 提高 30% 的 命中 率 ) 。 如 果 仅 简 
单 地 增加 缓存 容量 ， 那 么 仅 可 能 将 命中 率 提高 1% ~4% ， 而 且 还 不 能 保证 达到 这 个 数值 。 


缓存 、 散 列 以 及 二 进 制 位 ， 天 哪 ! 


假设 你 有 很 大 的 一 组 数据 ， 而 且 你 想 写 一 段 程序 以 实现 查找 数据 集 。 数 据 可 以 存放 在 数组 
中 ,在 这 一 点 上 你 可 以 有 两 种 选择 ， 如 果 数 据 是 无 序 的 ， 那 么 可 以 用 线性 查找 来 定位 专门 信 
息 ; 若 数据 是 有 序 的 ， 则 将 使 用 二 分 查找 。 但 是 这 两 种 类 型 的 查找 时 间 都 取决 于 所 用 数组 的 
大 小 。 

散 列 是 一 个 允许 我 们 用 平均 时 间 来 存储 并 查找 数据 的 过 程 ， 不 依赖 于 所 查找 数组 的 大 小 。 
散 列 是 通过 将 一 个 键 值 传送 到 一 个 地 址 来 将 某 项 插入 到 结构 中 的 过 程 。 通 常 的 散 列 表 用 来 存储 
散 列 值 ， 散 列 函 数 实现 键 值 到 地 址 的 转换 。 当 想 查找 某 一 个 数值 时 ， 应 将 对 应 的 键 值 放 入 散 列 
函数 ， 输 出 就 是 表 中 存放 数值 的 地 址 。20 世纪 60 年 代 ， 编 译 器 的 编写 者 发 明了 散 列 表 来 保存 
符号 表 ( 如 第 4 章 所 述 )。 

假设 你 疲 于 在 一 个 超 长 的 电话 本 中 查找 人 名 ,尽管 人 名 已 经 排序 了 ,但 页 码 太 多 ， 因 此 找 
到 某 个 号 码 也 会 花费 不 涩 时间。 这 时 你 可 以 创建 一 个 散 列 函 数 来 将 这 些 名 字 和 号 码 存储 在 计算 
机 的 一 个 散 列表 里 。 当 你 想 找 一 个 号 码 时 ， 所 有 你 需要 做 的 就 是 将 人 名 插入 到 散 列 函数 中 ， 继 
而 ， 散 列 函数 就 会 返回 散 列表 中 正确 对 应 电话 号 码 的 位 置 。 因 为 查找 时 间 远 小 于 二 分 查找 ， 所 
以 在 电子 词典 中 常常 使 用 散 列 表 来 存储 单词 和 释义 。 

散 列 之 所 以 成 功 就 是 因为 其 具有 出 色 的 散 列 函数 一 一 出 色 的 散 列 函 数 呈 现 均匀 分 布 ， 即 使 
键 值 分 布 不 那么 好 。 一 个 完美 的 散 列 函 数 是 一 个 值 到 表 的 一 对 一 映射 。 但 完美 散 列 函数 很 难 构 
建 。 散 列 函 数 将 大 多 数值 映射 到 特定 位 置 是 可 以 让 人 接受 的 ， 冲 突 (两 个 值 映 射 到 同一 位 置 ) 
的 数目 最 小 化 了 。 有 几 种 方法 可 以 处 理 冲突 ， 最 简单 的 就 是 链接 。 链 接 是 简单 创建 链表 的 过 
程 ， 将 项 映射 到 特定 位 置 。 当 一 个 键 值 映射 到 链表 时 ， 需 要 更 多 时 间 来 找到 项 ， 原因 是 我 们 不 
得 不 查找 整个 链表 。 

散 列 函数 可 简单 可 复杂 。 带 数值 型 键 值 的 简单 散 列 函数 包括 : (1) 模 运算 。 模 运算 会 估计 
表 中 项 的 数目 ， 这 个 数目 作为 除数 ， 键 值 为 被 除数 ,余数 就 是 散 列 值 。(2) 基 值 转换 。 在 这 个 
过 程 中 十 进 制 键 值 的 基 值 是 变化 的 ， 这 样 会 产生 一 个 不 同 的 数字 序列 ， 这 些 数字 的 特定 “ 子 
串 ” 作 为 散 列 值 。(3 ) 键 值 换 位 。 一 部 分 键 值 中 的 数字 被 简单 地 划 去 ， 并 且 新 划 去 的 值 用 作 散 
列 值 。(4) 折 又 。 这 个 方法 的 关键 在 于 分 成 几 个 部 分 ， 这些 部 分 加 在 一 起 ， 并 且 将 结果 的 一 部 
分 作为 散 列 值 。 对 于 以 上 通讯 录 的 例子 ,我 们 可 以 用 一 个 字符 的 ASCII 值 替换 人 名 中 的 每 个 字 
母 ， 并 通过 选择 基数 来 采用 基 值 转换 ， 将 每 个 ASCII 码 值 乘 以 该 基 值 的 震 ， 并 使 结果 相 加 以 产 
生 散 列 值 。 例如， 如 果 人 名 为 “Tim”， 而 基 值 为 8， 则 散 列 值 将 为 (84 x8 ) +(105 x8 ) + 
(109 x8") =6325， 这 意味 着 我 们 可 以 在 散 列表 的 位 置 6325 处 找到 Tim。 
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散 列 法 在 许多 计算 机 中 都 有 应 用 。 例 如 ,网络 浏 览 器 使 用 散 列 缓存 来 存储 最 近 浏 览 的 网 
页 。 散 列 用 于 存储 和 检索 索引 数据 库 系统 中 的 项 。 在 密码 学 、 消 息 认 证 和 错误 检查 中 使 用 了 著 
名 的 散 列 函 数 。 在 大 型 文件 系统 中 ， 使 用 缓存 技术 和 散 列 (确定 文件 位 置 ) 来 提高 性 能 。 

你 应 该 已 经 注意 到 了 散 列 和 本 章 讨论 的 缓存 映射 方案 之 间 有 相似 之 处 。 用 于 缓存 映射 的 
“ 键 ” 是 地 址 的 中 间 字 段 ， 即 直接 映射 中 的 块 字段 和 组 相 联 映射 中 的 组 字段 。 直 接 映 射 和 组 相 
联 映射 所 使 用 的 散 列 函数 是 简单 的 模 运算 ( 全 相 联 映射 不 使 用 散 列 函 数 ， 它 需要 对 缓存 进行 完 
整 的 搜索 以 找到 所 需 数据 ) 。 在 直接 映射 中 ， 如 果 有 冲突 ， 则 当前 缓存 中 的 值 会 由 传 入 值 替换 。 
在 使 用 组 相 联 缓存 时 ， 如 果 发 生 冲 突 ， 组 类 似 于 链接 中 的 列表 ， 这 取决 于 集合 的 大 小 ， 以 及 散 
列 到 的 同一 位 置 有 多 个 值 可 以 共存 。 若 要 在 组 相 联 缓存 中 检索 一 个 值 ， 那 么 一 旦 中 间 位 确定 了 
缓存 中 的 位 置 (或 组 )， 就 必须 搜索 该 组 以 获得 所 查找 的 值 。 回 想 一 下 ,每 个 值 都 存储 一 个 标 
记 ， 用 于 标识 正确 的 项 。 

不 同 的 项 可 以 用 作 散 列 的 键 。 我 们 在 缓存 映射 中 使 用 所 需 值 物理 地 址 的 中 间 位 作为 键 。 但 
是 为 什么 要 使 用 中 间 位 呢 ? 较 低 的 位 (右边 的 字段 ) 用 来 确定 块 的 偏 移 量 。 然 而 ， 较 高 的 位 ( 左 
边 的 字段 ) 可 以 用 作 键 代替 中 间 位 (并 且 相 应 地 ， 中 间 位 也 可 以 作为 标记 )。 但 设计 人 员 为 什么 
选择 中 间 位 ? 

主 存 交 叉 有 两 种 选择 : 高 位 交叉 和 低位 交叉 。 高 位 交叉 使 用 高 位 来 确定 存储 器 模块 的 位 
置 ， 并 在 同一 模块 中 存放 和 连续 的 主 存 地 址 。 如 果 我 们 使 用 主 存 地 址 的 高 位 来 决定 缓存 位 置 一 一 
来 自 连续 主 存 地 址 的 值 会 映射 到 缓存 的 相同 位 置 ， 这 会 非常 精确 。 空 间 局 部 性 告诉 我 们 ， 彼 此 
接近 的 主 存 位置 往 往 在 聚 类 中 被 引用 。 如 果 相 邻 主 存 位 置 的 值 映 射 到 相同 的 缓存 块 或 组 中 ， 则 
空间 局 部 性 意味 着 将 发 生 冲 突 ( 较 大 的 组 有 更 少 的 冲突 )。 但 是 ， 如 果 中 间 位 用 作 键 ， 则 相 邻 
的 主 存 位 置 会 映射 到 不 同 的 缓存 位 置 ， 从 而 减少 冲突 ， 并 最 终 获得 更 好 的 命中 率 。 


6. 4.6 指令 和 数据 缓存 


在 对 缓存 的 讨论 中 ,我 们 聚焦 于 所 谓 的 统一 或 集成 缓存 ， 即 保存 很 多 最 近 访问 过 的 指令 
和 数据 的 缓存 。 但 是 ， 大 多 现代 计算 机 采用 哈佛 缓存 ， 它 是 指令 和 数据 存放 在 单独 的 缓 
存 中 。 

数据 缓存 仅 用 来 存放 数据 ， 当 对 主 存 请 求 数据 时 ， 首 先 要 查找 数据 缓存 。 如 果 在 此 缓存 中 
找到 了 所 需 数据 ， 那 么 将 会 把 数据 取出 并 且 继续 执行 。 如 果 请 求 的 数据 不 在 数据 缓存 中 ， 则 会 
从 主 存 中 请 求 数据 并 同时 将 数据 传 到 数据 缓存 。 具 有 良好 局 部 性 的 数据 会 有 较 高 的 命中 率 。 比 
如 说 ， 数 组 中 的 数据 就 比 链表 中 的 数据 有 更 好 的 局 部 性 ， 因 此 ， 编 程 使 用 的 方法 会 影响 数据 组 
存 的 命中 率 。 

只 有 当 数 据 缓存 的 命中 率 很 高 时 ， 指 令 缓 存 的 命中 率 才 能 对 高 性 能 有 重要 的 推动 作用 。 大 
多 数 的 程序 指令 都 是 顺序 执行 的 ， 仅 当 遇 到 过 程 调用 、 循 环 以 及 条 件 语句 时 ， 才 会 发 生 分 支 。 
因此 ， 程 序 指 令 倾 向 于 有 更 高 的 局 部 性 ， 甚 至 当 调用 一 个 过 程 或 执行 一 个 循环 时 ， 这 些 模块 也 
足够 小 以 至 于 能 放 到 指令 缓存 的 一 个 块 中 (这 也 是 鼓励 编写 小 过 程 语 句 的 一 个 动机 ) ， 因 此 它 
可 以 提升 性 能 。 

在 缓存 中 将 指令 从 数据 中 分 离 出 来 使 得 访问 的 随机 性 大 为 降低 并 且 更 为 紧凑 。 但 是 ， 某 些 
设计 者 倾向 于 选用 集成 缓存 。 为 了 达到 与 分 离 的 指令 和 数据 缓存 具有 相同 的 性 能 ， 集 成 缓存 的 
容量 更 大 ， 从 而 在 检索 数据 时 会 引入 更 多 的 延迟 。 另 外 ， 集 成 缓存 对 数据 和 指令 仅 有 一 个 端 
口 ， 从 而 会 在 两 者 之 间 造 成 冲突 。 

有 一 些 处 理 器 还 有 一 个 受害 者 缓存 ， 用 一 个 小 容量 相 联 存储 器 来 存放 那些 发 生 冲 突 时 从 
CPU 缓存 中 淘汰 出 来 的 块 。 设 置 受害 者 缓存 的 思想 是 淘汰 块 在 不 久 还 会 用 到 ， 那 么 到 时 就 
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可 以 用 比 访问 主 存 还 低 的 代价 从 受害 者 缓存 中 查找 到 数据 ， 这 就 给 了 淘汰 掉 的 数据 在 送 回 
主 存 之 前 的 第 二 次 使 用 机 会 。 另 一 种 专门 的 缓存 是 跟踪 缓存 ， 它 是 指令 缓存 的 一 个 变种 。 
它 用 于 存储 译 码 后 的 指令 序列 ， 从 而 当 指令 再 次 需要 时 ， 就 不 用 译 码 了 。 另 外 ， 处 理 器 能 
够 处 理 指令 块 并 且 不 用 担心 程序 流程 图 中 的 分 支 。 这 种 缓存 的 得 名 是 因为 它 存储 了 动态 指 
令 流 ， 使 不 连续 的 指令 看 上 去 就 像 连续 的 一 样 。Intel 的 PentiumJV 就 使 用 了 跟踪 缓存 来 提高 


6.4.7 缓存 的 级 别 


很 明显 ,缓存 技术 可 以 使 计算 机 系统 的 性 能 得 以 提升 ， 当 然 前 提 是 命中 率 应 令 人 满意 。 
你 首先 想到 的 可 能 就 是 通过 增加 缓存 容量 来 获得 更 高 的 命中 率 ， 然 而 越 大 容量 的 缓存 速度 
越 慢 (访问 时 间 更 长 ) 。 多 年 来 ， 制 造 商 一 直 在 尝试 选择 合适 大 小 的 缓存 来 平衡 大 容量 缓存 
的 高 延迟 和 提升 命中 率 之 间 的 关系 。 很 多 设计 者 正在 将 存储 器 层次 结构 的 概念 应 用 到 缓存 
中 来 ， 当 前 ， 他 们 正在 大 多 数 系统 中 应 用 多 级 缓存 层次 架构 一 一 多 个 缓存 使 用 缓冲 技术 来 提 
高 性 能 。 

正如 我 们 所 看 到 的 ，L1l 缓存 是 描述 驻 留 在 忆 片 本 身 中 的 缓存 的 术语 ， 它 是 最 快 、 最 小 的 
缓存 。L1 缓存 通常 称 为 “内 部 缓存 ”， 典 型 大 小 从 8 ~ 64KB。 当 请 求 一 个 主 存 地 址 时 ， 先 检查 
Ll 缓存 ， 访 问 时 间 一 般 约 4ns。 如 果 在 Ll 中 找 不 到 数据 ， 则 检查 第 L2 缓存 。L2 缓存 通常 位 于 
处 理 需 外 部 ， 访 问 时 间 为 13 ~ 20ns。L2 缓存 可 以 位 于 系统 主板 的 单独 芯片 上 ， 也 可 以 位 于 扩 
展板 上 。IL2 缓存 容量 更 大 ， 但 比 Ll 缓存 速度 慢 。 通 常 L2 缓存 的 大 小 从 64KB ~ 2MB。 如 果 在 
Ll 中 丢失 了 数据 ,但 在 L2 中 找到 ， 则 它 会 加 载 到 Ll 缓存 (在 某 些 体系 结构 中 ， 在 Ll 中 被 替 
换 的 数据 与 L2 中 被 请 求 的 数据 进行 交换 ) 。 越 来 越 多 的 制造 商 已 经 开始 在 其 体系 结构 中 包含 
L2 缓存 ,将 L2 缓存 与 CPU 放 在 同一 个 芯片 上 ， 从 而 使 L2 缓存 以 CPU 速度 运行 (但 与 CPU 不 
在 相同 的 电路 上 ， 就 像 Ll 缓存 那样 )。 这 使 得 L2 缓存 的 存 取 时 间 变 为 了 大 约 10ns。L3 缓存 现 
在 指 的 是 描述 处 理 器 和 内 存 之 间 的 额外 缓存 (过 去 称 为 [2 缓存 ) ， 因 为 在 处 理 器 中 已 包含 L2 
缓存 作为 其 体系 结构 的 一 部 分 。L3 缓存 的 大 小 从 8 ~256MB 不 等 。 

包容 缓存 是 允许 数据 同时 出 现在 多 级 的 缓存 。 例 如 ， 在 Intel Pentium 系列 机 中 ,在 Ll 中 
发 现 的 数据 也 可 能 存在 于 L2 中 。 一 个 严格 的 包容 缓存 会 保证 一 个 级 别 上 的 所 有 数据 也 在 下 一 
个 较 低 的 级 别 上 找到 。 独 占 缓存 保证 数据 最 多 在 某 一 级 缓存 中 。 

我 们 在 前 一 节 讨 论 了 单独 的 数据 和 指令 缓存 。 通 常 ， 体 系 结构 使 用 L2 和 L3 集成 缓存 。 然 
而 ， 许 多 架构 在 LI 上 有 单独 的 指令 和 数据 缓存 。 例 如 ，Intel Celeron 采用 两 个 独立 的 Ll 缓存 ， 
一 个 存放 指令 ， 一 个 存放 数据 。 除 了 这 一 非常 好 的 设计 之 外 ，Intel 采用 了 非 阻 塞 的 L2 级 缓存 。 
大 多 数 缓存 只 能 一 次 处 理 一 个 请 求 (因此 在 缓存 失效 时 ,缓存 必须 等 待 内 存 提供 请 求 的 数据 并 
将 其 加 载 到 缓存 中 ) 。 非 阻塞 高 速 缓存 可 以 并 发 处 理 多 达 4 个 用 户 请 求 。 


6.5 虚拟 存储 器 

现在 我 们 了 解 了 缓冲 技术 使 得 计算 机 可 以 在 一 个 小 容量 但 快速 的 缓存 中 访问 到 那些 经 常用 
到 的 数据 。 高 速 缓存 位 于 存储 层次 结构 的 顶端 。 在 存储 器 层次 结构 中 ， 另 一 个 很 重要 的 概念 是 
虚拟 存储 器 。 虚 拟 存储 器 的 目的 是 将 硬盘 作为 RAM 的 扩展 ， 因 此 增加 了 程序 所 能 访问 的 地 址 
空间 。 大 多 数 个 人 计算 机 都 有 一 个 小 容量 (通常 4GB 左右 ) 的 主 存 ， 这 个 容量 不 足以 确保 多 个 
程序 并 发 运行 ， 比 如 ， 一 个 字 处 理 程序 、 一 个 邮件 处 理 程序 和 一 个 图 形 应 用 程序 ， 另 外 还 有 操 
作 系 统 本 身 。 使 用 虚拟 存储 器 可 以 获得 比 主 存 实际 空间 更 大 的 可 寻 址 空间 ， 使 用 硬盘 来 容纳 多 
余 的 地 址 空间 。 硬 盘 上 的 这 部 分 叫 页 面 文件 ， 因 为 在 硬盘 上 存储 了 大 块 主 存 区 域 的 内 容 。 理 解 
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虚拟 存储 器 的 最 简单 方法 是 将 其 看 作 主 存 位 置 的 镜像 ， 而 所 有 的 寻 址 事务 都 是 由 操作 系统 来 解 
决 的 。 

实现 虚拟 存储 最 常见 的 方法 就 是 分 页 ， 即 将 主 存 划 分 成 固定 大 小 的 块 ， 并 将 程序 也 划分 成 
同样 大 小 的 块 。 通 常 ， 程 序 块 在 需要 时 才 被 调 入 主 存 ， 且 没有 必要 将 连续 的 程序 块 存 到 主 存 的 
连续 块 当 中 。 由 于 程序 块 可 以 无 序 存放 ， 所 以 一 旦 CPU 生成 了 要 访问 的 程序 地 址 ， 就 必须 将 
其 转换 为 主 存 地 址 。 记 住 ， 在 缓存 技术 中 ， 主 存 地 址 需要 转换 为 缓存 地 址 。 在 使 用 虚拟 存储 器 
时 也 是 如 此 ， 每 一 个 虚拟 地 址 都 需要 转换 为 物理 地 址 。 那 么 如 何 完成 这 个 转换 呢 ? 在 深入 探究 
虚拟 存储 器 的 概念 之 前 ， 让 我 们 先 来 对 通过 分 页 实现 虚拟 存储 时 经 常 使 用 的 一 些 术 语 来 进行 
定义 。 

e 虚拟 地 址 一 一 进程 所 使 用 的 逻辑 或 程序 地 址 。 不 管 CPU 何 时 生成 一 个 地 址 ， 它 总 是 根 

据 虚 拟 地 址 空间 得 来 的 。 

e 物理 地 址 一 一 物理 主 存 中 的 实际 地 址 。 

。 映射 一 一 将 虚拟 地 址 转换 为 物理 地 址 的 机 制 ( 和 缓存 的 映射 非常 相似 ) 。 

。 页 面 一 一 由 主 存 (物理 存储 器 ) 分 成 的 相同 大 小 的 块 。 

e。 页 一 一 由 虚拟 存储 器 (逻辑 地 址 空间 ) 分 成 的 块 ， 其 大 小 与 页 面相 同 ， 虚 页 在 调用 时 才 

存储 到 磁盘 上 。 

。 分 页 一 一 将 虚 页 从 磁盘 调 人 主 存 页 面 的 过 程 。 

。 碎片 一 一 主 存 中 不 能 使 用 的 部 分 。 

。 缺 页 故障 一 一 当 请 求 页 没 在 主 存 中 且 需 要 从 磁盘 拷贝 到 主 存 时 发 生 的 事件 。 

由 于 主 存 和 虚 页 都 分 成 了 相同 大 小 的 页 ， 所 以 进程 地 址 空间 片 在 需要 调和 人 主 存 时 无 须 连 续 
存放 。 如 前 所 述 ， 我 们 并 不 是 同时 需要 主 存 中 的 全 部 进程 ， 仅 当 指定 片 在 内 存 时 虚拟 存储 器 才 
允许 程序 运行 。 当 前 用 不 到 的 部 分 会 存放 在 磁盘 的 页 面 文件 中 。 

虚拟 存储 器 可 用 不 同 的 技术 来 实现 ， 包 括 分 页 、 分 段 或 者 两 者 结合 的 方式 ， 但 分 页 是 最 普 
遍 的 。( 这 部 分 内 容 在 操作 系统 中 有 详细 介绍 。) 就 像 缓存 一 样 ， 分 页 是 否 成 功 ， 也 取决 于 局 部 
性 原理 。 当 数据 没有 在 主 存 中 保存 时 ， 它 所 在 的 整 块 内 容 就 会 从 磁盘 拷贝 进 主 存 ， 希望 这 一 页 
中 的 其 他 数据 会 在 接 下 来 的 程序 执行 中 用 到 。 


6.5;1 分 页 


分 页 背后 的 思想 非常 简单 : 把 物理 内 存 用 固定 大 小 的 块 (页 面 ) 分 配给 各 个 进程 ， 并 且 通 
过 页 表 中 的 记录 信息 来 跟踪 进程 中 大 量 页 面 的 驻 留 情况 。 每 个 进程 都 有 自己 的 页 表 ， 页 表 通 常 
驻 留 在 主 存 中 ， 页 表 存储 了 进程 中 每 一 个 虚 页 所 存 人 的 物理 位 置 。 页 表 有 NN 行 ， 其 中 刘 是 进 
程 中 所 包含 的 虚 页 数 。 如 果 进 程 的 某 些 页 现在 不 在 主 存 中 ， 则 页 表 通 过 设置 有 效 位 为 0 来 说 明 
这 一 情况 ; 如 果 该 页 在 主 存 中 ， 则 有 效 位 置 为 1。 因 此 ， 页 表 的 每 一 个 人 口 都 有 两 个 字段 : 有 
效 位 和 页 面 编 号 。 

也 经 常用 附加 字段 来 传达 更 多 信息 。 比 如 ， 一 个 脏 位 (或 修改 位 ) 可 用 于 表示 虚 页 是 否 被 
改变 。 这 使 某 页 传 回 磁盘 的 过 程 更 高 效 ， 因 为 如 果 这 一 页 没有 被 修改 过 ， 那 么 就 无 须 重 写 磁 
盘 。 可 添加 另 一 个 附加 位 (使 用 位 ) 来 表示 页 的 使 用 情况 。 一 旦 这 一 页 被 访问 ， 则 此 位 就 会 置 
为 1。 过 一 段 时 间 后 ， 此 位 会 变 为 0， 当 这 个 页 再 次 被 引用 时 ， 此 位 又 会 变 为 1。 但是， 如 果 这 
位 保持 0 的 状态 ， 这 就 意味 着 这 一 页 已 经 有 有 段 时 间 未 被 访问 过 了 ， 那么 系统 就 会 将 该 页 存 回 磁 
盘 ， 并 从 中 受益 。 通 过 这 种 方式 ， 系 统 可 以 将 这 一 页 的 位 置 释 放 给 进程 最 终 会 用 到 的 其 他 页 
(在 讲 替 换 方 法 时 ， 我 们 会 详细 介绍 ) 。 

虚 页 的 大 小 和 主 存 页 面 一 样 。 进 程 存储 器 被 分 成 了 固定 大 小 的 页 ， 当 最 后 一 页 调和 人 主 存 时 
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有 可 能 产生 内 部 碎片 。 一 个 进程 可 能 并 不 需要 整个 页 面 ， 但 别 的 进程 也 不 能 使 用 页 面 内 的 剩余 
部 分 。 因 此 ， 在 最 后 一 个 页 面 中 未 使 用 的 存储 空间 就 浪费 了 。 这 可 能 发 生 在 进程 本 身 需 要 的 空 
间 小 于 一 个 完整 页 ， 但 它 又 必须 要 将 整个 页 面 拷贝 进 主 存 时 。 内 部 碎片 是 指 在 给 定 的 存储 器 区 
域 中 (这 里 指 一 页 ) 不 能 使 用 的 空间 。 

现在 你 理解 了 什么 是 分 页 ， 接 下 来 我 们 讨论 它 的 工作 原理 。 当 一 个 进程 生成 一 个 虚拟 地 址 
时 ， 操 作 系 统 必 须 动 态 地 将 其 转换 为 主 存 物 理 地 址 ， 即 数据 驻 留 的 实际 位 置 。( 为 了 简化 问题 ， 
假设 此 时 没有 用 到 缓存 ) 。 比 如 ， 从 程序 角度 来 讲 ， 我 们 已 知 一 个 10 字 节 程序 的 最 后 一 个 字 节 
的 存放 地 址 为 0x09。 假 设 指 令 和 地 址 都 占 一 个 字 节 ， 且 起 始 地 址 为 0x00。 但 是 ， 当 实际 读 入 
主 存 时 ， 逻 辑 地 址 0x09( 可 能 引用 的 是 汇编 语言 程序 中 的 标签 X) 中 的 内 容 可 能 实际 存放 在 主 
存 地 址 0x39 处 ， 这 意味 着 此 程序 加 载 到 主 存 的 位 置 从 物理 地 址 0x30 开始 。 这 要 求 必须 有 一 种 
简单 方法 来 将 逻辑 或 虚拟 地 址 0x09 转换 为 物理 地 址 0x39 。 

为 了 完成 地 址 转换 ， 应 将 虚拟 地 址 分 成 两 个 字段 : 页 号 字段 和 偏 移 字 段 ( 指 的 是 请 求 数据 
在 这 一 页 内 的 偏 移 ) 。 这 一 地 址 转换 过 程 与 之 前 我 们 用 过 的 将 主 存 地 址 分 段 来 完成 缓存 映射 算 
法 是 相似 的 。 并 且 与 缓存 块 类 似 ， 页 的 大 小 通常 也 是 2 的 整数 次 宕 ， 这 就 简化 了 页 号 和 页 内 偏 
移 从 虚拟 地 址 中 的 抽取 过 程 。 

为 了 访问 给 定 虚拟 地 址 中 的 数据 ， 系 统 执行 以 下 步骤 : 

e 从 虚拟 地 址 中 抽取 出 页 号 ; 

e 从 虚拟 地 址 中 抽取 出 页 内 偏 移 ; 

e 通过 访问 页 表 ， 将 页 号 翻译 为 物理 页 面 号 : 

1. 在 页 表 中 查找 页 号 (使 用 虚拟 页 号 作为 索引 ) 
2. 检查 该 页 的 有 效 位 
1) 如 果 有 效 位 为 0， 则 系统 产生 页 面 故障 ， 且 操作 系统 必须 要 介入 以 便 : 
a) 在 磁盘 上 找到 所 请 求 的 页 ; 
b) 在 主 存 中 找到 一 个 空闲 页 面 (当主 存 已 满 时 ， 可 能 需要 从 主 存 中 删除 一 个 淘汰 
页 ， 并 将 其 拷贝 到 磁盘 中 ) ; 
c) 将 请 求 页 拷贝 到 主 存 的 空闲 页 面 中 ; 
d) 更 新 页 表 ( 刚 调和 的 虚 页 必须 有 对 应 的 页 面 编号 ， 页 表 中 的 有 效 位 也 需要 修改 。 
如 果 有 淘汰 页 ， 则 它 的 有 效 位 必须 置 为 0); 
e) 继续 执行 引起 页 面 故 障 的 进程 ， 直 至 步骤 B2。 
2) 如 果 有 效 位 为 1， 则 表示 请 求 页 在 主 存 中 。 
a) 用 实际 页 面 号 取代 虚拟 页 号 ; 
b) 通过 将 页 内 偏 移 地 址 附加 到 虚拟 页 号 对 应 的 页 面 上 来 访问 物理 页 面 上 指定 偏 移 
地 址 处 的 数据 。 

请 注意 ， 当 发 生 页 面 故 障 时 ， 如 果 一 个 进程 在 主 存 中 有 空闲 页 面 ， 则 最 近 被 检索 的 页 能 够 
存放 在 任意 一 个 空闲 页 面 上 。 但 是 如 果 分 配给 此 进程 的 主 存 都 被 占 满 了 ， 则 必须 选择 一 页 淘汰 
出 主 存 。 选 择 淘汰 块 的 替换 算法 和 缓存 中 用 到 的 非常 相似 。FIFO 、 随 机 算法 以 及 LRU 都 可 以 
用 来 选择 一 个 淘汰 块 。( 关 于 替换 算法 的 更 多 信息 ， 请 参阅 本 章 最 后 的 参考 文献 。) 

下 面 我 们 来 看 一 道 例 题 。 

假设 某 进程 的 虚拟 地 址 空间 大 小 为 2 字 节 。( 这 意味 着 程序 可 生成 的 地 址 范围 为 
0x00 ~0xFF， 即 十 进 制 的 0 ~255) ， 物 理 内 存 包含 4 个 页 面 (没有 缓存 ) 。 假 设 页 的 长 度 为 32 字 
节 ， 则 虚拟 地 址 有 8 位 ， 而 物理 地 址 包含 7 位 (每 32 字 节 有 4 个 页 面 ， 共 128 字 节 ， 即 2 ) 。 
还 假设 进程 中 的 某 些 页 已 经 被 调 入 到 主 存 中 ， 图 6-18 给 出 了 系统 的 当前 状态 。 
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图 6-18 使 用 分 页 和 相 联 存储 器 页 表 的 当前 状态 


每 一 个 虚拟 地 址 有 8 位 ， 并 且 划 分 成 两 个 字段 : 页 号 字段 包含 3 位 ， 表 示 虚 拟 存储 器 中 共 
有 2 页 ，(2”/2”) =2’。 每 一 页 的 长 度 是 2 =32 字 节 ， 
因此 页 内 偏 移 字 段 有 5 位 (假设 采用 字 节 寻 址 )。 因 
此 , 一 个 8 位 虚拟 地 址 的 格式 如 图 6-19 所 示 。 

假设 系统 当前 生成 了 一 个 虚拟 地 址 0x0D = 
00001101,， 将 此 二 进 制 地 址 划分 为 页 号 和 偏 移 两 个 字 。 图 6-19 页 大 小 为 32 字 节 时 8 位 虚拟 
段 ( 见 图 6-20)， 可 知 页 号 字段 P=000,， 并且 偏 移 字 地 址 的 格式 
段 等 于 01101,。 为 了 继续 执行 地 址 转换 过 程 ， 我 们 将 
页 号 字段 的 值 000 作为 索引 来 查询 页 表 ， 定 位 到 页 表 的 第 0 行 ， 可 知 ， 虚 拟 页 号 0 映射 到 物理 
页 面 2 =10,。 因 此 转换 得 到 的 物理 地 址 就 变 为 页 面 2 中 偏 移 量 为 13 的 单元 。 注 意 ， 一 个 物理 
地 址 仅 有 7 位 (页 面 占 2 位 ， 因 为 共有 4 个 页 面 ， 而 偏 移 占 5 位 )。 写 成 二 进 制 形 式 并 用 两 个 字 









段 表 示 ， 即 为 1001101,， 或 地 址 =0x4D。 如 图 6-21 所 示 。 
A < > 


3 位 5 位 2 位 5 位 

图 6-20 虚拟 地 址 00001101, =0x0D 的 格式 图 6-21 物理 地 址 1001101, =4D1 的 格式 

我 们 接着 看 一 个 真实 (但 小 ) 系 统 (也 没有 缓存 ) 中 的 完整 例子 。 

假设 某 程序 长 16 字 节 。 需 要 访问 一 个 采用 字 节 寻 址 的 容量 为 8 字 节 的 主 存 ， 假 
设 每 一 页 大 小 为 2 字 节 。 当 程序 运行 时 ， 生 成 以 下 地 址 串 : 0x0、0xl1、0x2、0x3、0x6、0x7、 
0xA、0xB。( 这 一 地 址 引用 字符 串 表示 的 原因 是 地 址 0x0 是 首先 被 引用 的 ， 接 着 是 0xl ， 然 后 
0x2， 依 次 类 推 ) 。 初 始 时 ， 主 存 没有 存放 该 程序 的 任何 页 。 当 请 求 地 址 0x0 时 ，0x0 和 0x1( 都 
在 页 0 中 ) 一 起 被 拷贝 到 主 存 的 页 面 2 中 。( 可 能 主 存 的 页 面 0 以 及 页 面 1 均 被 其 他 程序 占用 因 
而 不 可 用 ) 。 由 于 请 求 页 必须 从 磁盘 调 人 主 存 ， 因 此 这 是 关于 页 面 故障 的 一 个 示例 。 当 引用 地 
址 0xl 时 ， 其 中 的 数据 已 经 存在 于 主 存 中 了 (因此 会 产生 页 命中 ) 。 当 引用 地 址 0x2 时 ， 会 引起 
另 一 个 页 面 故障 ， 随 后 将 程序 的 页 号 1 拷贝 到 主 存 的 页 面 0 中 。 继 续 这 个 过 程 ， 在 这 些 给 定 地 
址 都 被 引用 后 ， 并 且 所 需 页 都 调和 信 到 内 存 页 面 后， 系统 状态 如 图 6-22a 所 示 。 从 图 中 可 以 看 
出 ， 程 序 地 址 0x0 中 存放 的 是 “A”， 当 前 存储 在 主 存 地 址 0x4 = 100, 中 。 因 此 ，CPU 必须 将 虚 
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拟 地 址 0x0 转换 为 物理 地 址 0x4 ， 可 用 前 面 提 到 过 的 地 址 转换 方案 来 实现 转换 过 程 。 注 意 主 存 
地 址 共有 3 位 ( 主 存 中 一 共有 8 字 节 ) ， 但 虚拟 地 址 (本 程序 中 ) 是 4 位 (因为 虚拟 地 址 共 包 含 16 
字 节 )。 因 此 ， 地 址 转换 必须 将 4 位 地 址 转换 为 3 位 。 

图 6-22b 给 出 了 在 给 定 页 均 被 访问 之 后 ， 该 进程 的 页 表 状 态 。 由 图 中 可 以 看 出 ， 进 程 的 页 
0、1、3 和 5 是 有 效 的 ， 因 此 它们 都 驻 留 在 主 存 中 。 页 2、6 和 7 是 无 效 的 ， 因 此 一 旦 访问 这 些 
页 就 会 发 生 页 面 故障 。 








了 0 = 000 
总 1 = 001 
2 = 010 
3 = 011 
室 4= 100 
= 5 = 101 
= 6 = 110 
一 和 
页 
0 
. 4 位 ( 存储 值 K ) 3 位 
3 f Y 
4 
. | 
6 i A 一 一 
7 Wa 0 | 页 面 5 页 内 偏 移 0 页 面 3 页 内 偏 移 0 
b ) 页 表 c ) 虚拟 地 址 0xA = 1010， d ) 物理 地 址 
图 6-22 例 6.9 中 使 用 分 页 的 小 存储 器 本 


我 们 仔细 看 看 这 个 转换 过 程 。 使 用 例 6. 9 所 示 的 架构 ， 假 设 CPU 第 二 次 生成 程序 或 虚拟 地 
址 0xA =1010,， 由 图 6-22a 可 以 看 出 ， 该 地 址 中 存放 的 是 字符 “K”， 对 应 地 存储 在 主 存 地 址 
0x6 =0110, 上。 然而 ,计算机 为 了 找到 这 个 数据 必须 有 一 个 专门 的 地 址 转换 过 程 。 为 了 完成 这 
一 目标 ， 虚 拟 地 址 1010, 被 划分 为 一 个 页 号 字段 和 一 个 偏 移 字 段 。 因 为 程序 中 共有 8 页 ， 故 页 
号 字段 长 3 位 。 还 剩 1 位 ， 分 给 偏 移 字段 ， 由 于 每 页 只 有 2 个 存储 字 ， 故 这 个 位 数 正好 能 满 
足 。 字 段 划分 见 图 6-22c。 

一 旦 计算 机 获取 了 这 些 字段 ， 那 么 接 下 来 转换 为 物理 地 址 的 过 程 就 很 简单 了 。 页 号 字段 的 
值 101, 用 来 作为 查找 页 表 的 索引 。 因 为 101, =5， 所 以 使 用 5 作为 偏 移 量 定位 到 页 表 中 ( 见 图 6- 
22b) ， 并 可 以 看 到 虚拟 页 号 5 映射 到 了 物理 页 面 3。 现 在 可 以 用 3 =11, 来 替换 5 =101,， 但 是 
页 内 偏 移 相同 。 则 新 生成 的 物理 地 址 是 110,， 见 图 6-224。 这 一 过 程 成 功 将 虚拟 地 址 转换 到 物 
理 地 址 并 将 所 需 位 数 从 4 位 降 到 3 位 。 

现在 知道 了 一 个 小 例子 的 工作 原理 ， 我 们 已 经 做 好 准备 来 看 一 个 更 大 的 更 实际 的 例子 。 

(ED 假设 我 们 有 一 个 8K 字 节 的 虚拟 地 址 空间 ， 采 用 字 节 寻 址 的 物理 内 存 大 小 为 4K 
字 节 ， 页 大 小 为 1K 字 节 。( 这 个 系统 也 没有 缓存 ， 但 我 们 能 更 好 地 理解 存储 器 的 工作 原理 ， 
并 且 在 这 个 例子 中 最 终 会 使 用 缓存 和 分 页 。) 虚拟 地 址 共有 13 位 (8K =28) ， 其 中 3 位 用 来 表示 
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页 号 (共有 2 /2”=2 个 虚 页 ) ，10 位 用 来 表示 页 内 偏 移 (每 一 页 有 2" 字 节 )。 物 理 地 址 仅 有 12 
位 (4K =2")， 最 高 2 位 表示 页 号 字段 ( 主 存 中 共有 2 个 页 面 ) ， 剩 下 的 10 位 表示 页 内 偏 移 。 虚 
拟 地 址 和 物理 地 址 的 格式 见 图 6-23a。 

虚拟 地 址 空间 : 8K = 28 


物理 存储 器 : 4K =22 
页 大 小 : 1K=2' 物理 地 址 











13 12 
\ 一 一 -一 一 J OO 
10 这 10 
a ) 虚拟 地 址 
页 0 基 值 为 10 基 值 16 
1 页 0 - 1023 0 - 3FF 
2 1 : 1024 - 2047 400 - 7FF 
3 2 : 2048 - 3071 800 - BFF 
7 3 : 3072 - 4095 C00 - FEF 
4 : 4096 - 5119 1000 - 13FF 
5 5 : 5120 - 6143 1400 - 17FF 
6 6 6144 - 7167 1800 - 1BFF 
7 7 : 7168 - 8191 1C00 - 1FFF 
c ) 地 址 
13 
MR 5 于 
d ) 虚拟 地 址 0x1553 转 换 Qa 0101010011 
为 物理 地 址 0x553 T 
页 号 5 122 


0101010011 


Ne 


e ) 虚拟 地 址 0x802 转 换 
为 物理 地 址 0x002 





f) 虚拟 地 址 0x1004 


图 6-23 使 用 分 页 的 大 容量 存储 器 的 例子 


我 们 假设 页 表 如 图 6-23b 所 示 。 图 6-23C 所 示 的 表 给 出 了 对 于 描述 地 址 转换 过 程 有 用 的 主 
存 的 不 同 地 址 。 

假设 CPU 当前 产生 虚拟 地 址 0x1553 =1010101010011,。 图 6-23d 描述 了 这 个 地 址 是 如 何 被 
分 解 为 页 号 和 页 内 偏 移 字 段 的 ， 以 及 它 如 何 被 转换 为 物理 地 址 0x553 =010101010011, 。 本 质 上 
来 说 ， 虚 拟 地 址 的 页 号 字段 101 由 主 存 页 面 号 01 取代 了 ， 因 为 页 号 5 映射 到 了 主 存 页 面 1( 如 
页 表 中 所 示 ) 。 图 6-23e 给 出 了 虚 地 址 0x802 是 如 何 转换 成 物理 地 址 0x002 的 。 图 6-23f 给 出 虚 
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地 址 0x1004 会 产生 页 面 故 障 ， 页 面 4 = 100, 在 页 表 中 是 无 效 的 。 4 
假设 一 台 计 算 机 有 32 位 虚拟 地 址 ， 页 大 小 为 4K， 主 存 采用 字 节 寻 址 且 容量 为 
1CB。 已 知 部 分 页 表 ， 要 求 将 虚拟 地 址 0x0011232A 转换 为 物理 地 址 。 在 本 例 中 ,页 号 和 页 面 
编号 用 十 六 进 制 表示 。 
虚拟 地 址 0x0011232A 的 地 址 格式 见 图 6-24。 一 个 虚拟 地 址 共和 包含 32 位， 其 中 12 位 代表 
页 内 偏 移 (因为 页 大 小 为 4K =22 ) 。 余 下 20 位 表示 虚拟 页 号 : 0000 0000 0001 0001 0010, = 
0x00112。 物 理 地 址 的 格式 见 图 6-25。 偏 移 字段 必须 有 12 位 ， 但 一 个 物理 地 址 仅 有 30 位 (1GB = 
2”) ， 因 此 页 面 字段 仅 占 18 位 。 如 果 我 们 用 虚拟 地 址 00112 来 查 页 表 ， 可 看 出 该 行 是 有 效 的 ， 
并 映射 到 主 存 页 面 3FOOF 上 。 如 果 将 3FOOF 代入 到 页 面 字段 ， 将 会 得 到 主 存 地 址 11 1111 0000 
0000 1111, =0x3F00F32A， 如 图 6-25 所 示 。 
页 表 
亲人 一 


0000 | 00000 | 1 | 0000 0000 0001 0001 0010 0011 0010 1010 


三 OA121 区 20 位 EE 








oma | sroor | 1 | 
ee 





图 6-24 虚拟 地 址 0x1211232A 的 格式 


< 30 位 CC 





11 1111 0000 0000 1111 0011 0010 1010 
18 位 12 位 
图 6-25 物理 地 址 0x3F00F32A 的 格式 本 


值得 一 提 的 是 ， 选 择 合适 的 页 大 小 是 非常 困难 的 。 页 越 大 ， 页 表 越 小 ， 因 此 可 以 节省 主 存 
空间 。 但 是 ， 如 果 页 太 大 ， 内 部 碎片 就 会 变 得 严重 。 更 大 的 页 也 意味 着 从 磁盘 到 主 存 所 需 的 传 
输 次 数 更 少 ， 原 因 就 是 要 传输 的 块 变 大 了 。 但是， 如 果 块 太 大 了 ， 那么 局 部 性 原理 开始 失效 ， 
于 是 我 们 就 会 在 传输 那些 不 必要 的 数据 时 浪费 资源 。 


6. 5.2 使 用 分 页 管理 的 有 效 访问 时 间 

当 我 们 讨论 缓存 时 ， 引 入 了 有 效 访问 时 间 的 概念 。 使 用 虚拟 存储 融 时 ， 也 需 用 到 它 。 这 是 
一 个 与 虚拟 存储 器 有 关 的 时 间 惩罚 : 对 由 处 理 器 生成 的 每 一 次 存储 器 访问 ， 都 有 两 次 物理 主 存 
的 访问 一 一 一 次 是 访问 页 表 ， 一 次 是 访问 我 们 和 希望 的 实际 数据 。 很 容易 看 出 ， 它 是 如 何 影响 有 
效 访问 时 间 的 。 假 设 主 存 访问 需要 200ns， 页 面 失效 率 为 1% (也 就 是 说 ， 在 99% 的 时 间 内 ， 都 
可 以 在 主 存 中 找到 所 需 页 的 内 容 ) 。 假 设 需要 10ms 来 访问 一 个 不 在 主 存 中 的 页 。( 这 10ms 包 
含 必须 将 虚拟 页 传输 到 主 存 的 时 间 ， 更 新 页 表 的 时 间 ， 以 及 访问 数据 的 时 间 ) 。 一 次 存储 器 的 
有 效 访 问 时 间 为 : 





EAT =0. 99 x (200ns +200ns) +0.01 x(10ms) =100. 396ns 
如 果 100% 的 页 都 存放 于 主 存 中 ， 则 有 效 访 问 时 间 将 变 为 : 
EAT =1. 00 x (200ns +200ns) =400ns 
这 也 会 导致 存储 器 访问 时 间 加 倍 。 访 问 页 表 花 费 了 额外 的 一 次 存储 器 访问 时 间 ， 因 为 页 表 





本 身 是 存放 在 主 存 中 的 。 

通过 在 页 表 缓 存 中 存储 最 近 访问 过 的 叫 作 转换 后 援 缓冲 器 (TLB ) 的 页 表 查 找 值 来 加 速 页 表 查 
找 过 程 。 每 一 条 TLB 记录 都 包含 一 个 虚拟 页 号 和 对 应 的 主 存 
页 面 号 。 在 例 6. 10 中 页 表 可 能 有 的 TLB 状态 见 图 6-26。 

通常 ，TLB 由 相 联 缓存 来 实现 ， 并 且 虚 拟 页 /物理 页 
面 对 可 被 映射 到 任意 位 置 。 下 面 是 使 用 TLB 完成 地 址 查找 
所 需 的 必要 步骤 ( 见 图 6-27) 。 

1. 从 虚拟 地 址 中 提取 出 页 号 ; 

2、 从 虚拟 地 址 中 提取 出 页 内 偏 移 ; pe 

3. 在 TLB 中 使 用 并 行 查找 技术 来 搜索 虚拟 页 号 ; 人 

4 如果 (虚拟 页 号 #， 物 理 页 面 号 #) 对 在 TLB 中 找到 了 ， 则 将 偏 移 字段 放 在 物理 页 面 号 后 
边 ， 并 访问 主 存 地 址 。 

5. 如 果 产 生 了 TLB 失效 ， 则 转 去 访问 页 表 以 取出 对 应 的 页 面 号 。 如 果 该 页 在 主 存 中 ， 则 
使 用 对 应 的 页 面 编号 和 页 内 偏 移 组 合 来 产生 物理 地 址 。 

6. 如 果 该 页 不 在 主 存 中 ， 则 会 产生 缺 页 故障 /页 面 失 效 ， 并 会 在 处 理 完 缺 页 故障 后 ， 重 新 
启动 此 次 访问 。 








图 6-27 使 用 TLB 





在 6.4 节 中 , 我们 提出 了 缓存 存储 器 。 在 对 分 页 的 讨论 中 ,我 们 也 引入 了 另 一 种 类 型 的 组 
存 一 一 TLB， 它 缓存 了 页 表 记 录 。TLB 使 用 相 联 映射 。 在 使 用 Ll 缓存 的 情况 下 ， 计 算 机 通常 有 
两 个 独立 的 TLB 一 一 一 个 用 于 指令 而 男 一 个 用 于 数据 。 


6. 5.3 汇总 : 使 用 缓存 、TLB 和 分 页 技术 


由 于 TLB 本 质 上 就 是 一 个 缓存 ， 所 以 将 标题 中 的 这 些 概念 放 到 一 起 会 令 人 迷惑 。 整 个 过 程 
的 演练 会 帮助 你 掌握 整体 思想 。 当 CPU 生成 一 个 地 址 时 ， 这 是 一 个 与 程序 相关 的 地 址 ， 或 一 
个 虚拟 地 址 。 在 数据 查找 能 继续 执行 之 前 ， 需 要 将 虚拟 地 址 转换 为 物理 地 址 。 这 有 两 种 方法 可 
以 实现 : (1) 通 过 定位 到 最 近 缓 存 的 (页 号 /页 面 ) 对 来 使 用 TLB 查找 页 面 ; (2) 在 TLB 失效 事 
件 中 ， 使 用 页 表 在 主 存 中 查找 相对 应 的 页 面 (通常 也 会 在 此 时 更 新 TLB) 。 这 个 页 面 号 和 在 虚拟 
地 址 中 给 出 的 偏 移 量 组 合 可 以 创建 物理 地 址 。 

此 时 ， 虚 拟 地 址 已 经 转换 成 物理 地 址 ， 但 是 该 地 址 中 的 数据 还 未 访问 到 。 查 找 数 据 也 有 两 
种 可 能 性 : 〈1) 搜 索 缓存 看 数据 是 否 存 在 其 中 ; (2) 在 缓存 失效 时 ， 转 去 实际 主 存 位置 以 检索 
数据 (通常 ， 缓 存 会 在 此 时 更 新 ) 。 

图 6-28 描述 了 同时 使 用 TLB、 分 页 和 缓存 时 的 过 程 。 


是 (现在 有 页 面 ) 





图 6-28 集中 到 一 起 : 同时 使 用 TLB、 页 表 、 缓 存 和 主 存 
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6. 5.4 分 页 和 虚拟 存储 器 的 优 缺 点 


在 6.5.2 节 中 ,我 们 已 讨论 了 当 访 问 数据 时 如 何 通过 分 页 加 上 外 部 存储 器 引用 来 实现 虚拟 
存储 器 的 。 通 过 使 用 TLB 来 缓存 页 表 记 录 的 时 间 惩 罚 被 部 分 缓解 了 。 然 而 ， 即 使 在 TLB 中 命 
中 率 很 高 ， 这 个 过 程 仍 旧 会 引起 地 址 转换 开销 。 虚 拟 存储 器 和 分 页 的 另 一 个 缺点 是 消耗 了 外 部 
资源 (存储 页 表 的 存储 器 开销 ) 。 在 极端 情况 (非常 大 的 程序 ) 下 ， 页 表 会 占用 物理 内 存 中 相当 
大 一 部 分 空间 。 后 一 个 问题 的 解决 方案 是 对 页 表 进 行 分 页 。 这 会 让 事情 变 得 非常 混乱 ! 虚拟 存 
储 器 和 分 页 也 需要 专门 硬件 和 操作 系统 的 支持 。 

使 用 虚拟 存储 器 的 好 处 肯定 胜 过 上 述 这 些 缺 点 ， 因 此 它 在 计算 机 系统 中 很 有 用 。 但 
虚拟 存储 器 和 分 页 的 好 处 是 什么 呢 ? 非常 简单 : 程序 不 用 受 可 访问 的 物理 主 存 空 间 的 限 
制 。 虚 拟 存储 器 使 得 我 们 可 以 运行 一 个 虚拟 地 址 空间 比 物理 存储 器 空间 还 要 大 的 程序 。 
(实际 上 ， 这 使 得 一 个 进程 可 以 和 其 本 身分 享 物理 主 存 ) 。 这 使 得 编写 程序 更 容易 ， 因 为 
程序 员 不 用 再 担心 物理 地 址 空间 大 小 的 限制 了 。 由 于 每 个 程序 需要 很 少 的 物理 主 存 ， 因 
此 虚拟 存储 器 允许 我 们 同时 运行 多 个 程序 。 这 使 得 我 们 在 各 个 进程 间 共 享 计算 机 ， 这 些 
进程 总 的 地 址 空间 超过 了 物理 存储 的 空间 ， 从 而 导致 计算 机 的 CPU 利用 率 和 系统 吞吐 量 
的 提高 。 

从 操作 系统 的 角度 来 讲 ， 页 面 和 页 大 小 的 固定 简化 了 分 配 和 替换 过 程 。 分 页 也 使 操作 系统 
能 在 每 一 个 页 上 指定 保护 (“这 一 页 属于 用 户 X 并 且 你 不 能 访问 它 ”) 和 共享 (“这 一 页 属于 用 户 
X 但 你 可 以 读 取 它 的 内 容 ”) 。 


6. 5.5 分 段 


尽管 分 页 是 最 常见 的 方法 ， 但 它 不 是 实现 虚拟 存储 器 的 唯一 方法 。 一 些 系 统 采用 了 第 二 种 
方法 ， 它 是 分 段 。 在 这 种 方式 中 ， 虚 拟 地 址 空间 被 分 成 逻辑 可 变 长 度 的 单元 或 段 ， 而 不 是 在 分 
页 方式 中 将 虚拟 地 址 分 成 相等 大 小 固定 的 页 ， 并 且 物 理 地 址 空间 也 被 分 成 相同 大 小 的 页 面 。 物 
理 存储 器 实际 上 不 进行 任何 形式 的 划分 。 当 一 个 段 需要 占用 物理 主 存 时 ， 操 作 系 统 会 在 主 存 中 
寻找 足够 大 的 空闲 块 来 存储 整个 段 。 每 一 个 段 都 有 一 个 基地 址 来 表示 它 存 储 到 了 主 存 的 哪个 位 
置 和 范围 限制 ， 从 而 表明 段 的 大 小 。 由 多 个 段 组 成 的 程序 都 有 一 个 相连 的 段 表 来 代替 页 表 。 段 
表 就 是 每 一 段 的 基 址 /范围 对 的 集合 。 

存储 器 访问 地 址 由 段 号 和 段 内 偏 移 转换 而 成 。 错 误 检 查 用 来 确保 这 个 偏 移 量 处 在 允许 的 范 
围 内 。 如 果 在 范围 以 内 ， 则 段 基 值 (在 段 表 中 可 找到 ) 加 上 偏 移 量 就 会 生成 实际 物理 地 址 。 因 
为 分 页 管理 基于 固定 大 小 的 块 而 分 段 基 于 逻辑 块 ， 故 使 用 分 段 更 容易 执行 保护 和 共享 。 比 如 ， 
虚拟 地 址 空间 可 以 被 分 成 一 个 代码 段 、 一 个 数据 段 、 一 个 堆栈 段 以 及 一 个 符号 表 段 ， 每 一 个 段 
的 大 小 都 不 同 。 如 果 说 “我 想 共 享 数据 ， 因 此 我 将 数据 段 对 每 个 人 都 开放 ”， 比 起 说 “好 ， 我 
的 数据 存放 在 一 些 页 ， 现 在 我 已 经 找到 这 4 页 了 ， 让 我 们 将 其 中 的 3 页 对 每 个 人 开放 ， 但 是 第 
四 页 中 仅 有 一 半 开 放 ” 更 容易 。 

如 同 分 页 管理 方式 ， 分 段 也 会 产 出 碎片 。 由 于 某 个 页 面 可 能 被 分 配给 一 个 并 不 需要 整个 页 
面 的 进程 ， 因 此 分 页 会 产生 内 部 碎片 。 另 一 方面 ， 分 段 会 产生 外 部 碎片 。 由 于 段 是 可 以 不 断 再 
分 配 的 ， 因 此 主 存 中 的 空闲 块 会 变 得 破碎 。 最 终 ， 主 存 里 会 有 很 多 小 块 ， 但 是 没有 一 块 能 够 存 
放下 整个 段 。 外 部 碎片 和 内 部 碎片 的 区 别 是 ， 在 外 部 碎片 中 ， 有 足够 的 主 存 总 空闲 块 分 配给 一 
个 进程 使 用 ， 但 这 个 空间 是 不 连续 的 一 一 它 是 大 量 的 小 的 、 没 用 的 孔洞 。 发 生 内 部 碎片 时 ， 主 
存 只 是 不 可 用 ， 因 为 系统 给 一 个 进程 过 度 分 配 了 它 并 不 需要 的 主 存 。 为 了 防止 外 部 碎片 的 产 
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， 系 统 使 用 某 种 垃圾 回收 的 方式 。 进 程 简单 地 通过 对 主 存 小 块 洗 牌 的 方式 来 将 这 些小 的 碎 块 
A 可 用 的 块 。 如 果 你 曾经 整理 过 磁盘 碎片 ， 那 么 你 就 见证 了 一 个 相似 的 过 程 ， 即 收 
集 磁盘 上 大 量 小 的 空闲 空间 ， 然 后 创建 少量 的 大 块 。 


6. 5.6 分 段 和 分 页 的 组 合 


分 页 和 分 段 是 不 同 的 。 分 页 基于 单纯 的 物理 值 : 程序 和 主 存 都 被 分 成 物理 大 小 相同 的 块 。 
必 一 方面 ， 分 段 根据 程序 的 逻辑 部 分 分 成 大 小 不 同 的 分 区 。 当 采用 分 段 方式 时 ， 用 户 知 道 段 的 
大 小 以 及 范围 ; 当 采 用 分 页 时 ， 用 户 不 知道 是 如 何 分 区 的 。 分 页 易于 管理 : 当 所 有 块 大 小 一 样 
时 ， 空 间 的 分 配 、 释 放 、 交 换 以 及 再 定位 都 很 容易 。 然 而 ， 页 的 大 小 通常 比 段 小 ， 这 就 意味 着 
有 更 多 的 开销 (就 跟踪 和 传输 页 所 需 资源 的 角度 而 言 ) 。 分 页 消除 了 外 部 碎片 ， 而 分 段 消灭 了 
内 部 碎片 。 分 段 可 以 支持 共享 和 保护 ， 而 分 页 很 难 做 到 这 些 。 

分 页 和 分 段 都 有 各 自 的 优点 。 一 个 系统 不 是 只 能 用 其 中 一 这 两 种 方式 可 以 组 合 使 
用 ， 以 努力 实现 两 全 其 美 。 在 组 合 方式 中 ， 虚 拟 地 址 空间 被 分 成 可 变 长 度 的 段 ， 段 再 被 分 成 固 
ER 主 存 被 分 成 大 小 相同 的 页 面 。 

一 个 段 都 有 一 个 页 表 ， 这 样 每 个 程序 都 有 多 个 页 表 。 物 理 地 址 被 划分 成 3 个 字段 。 第 一 
全 
个 字段 是 页 内 偏 移 字 段 。 

段 页 组 合 方式 优点 明显 ， 原 因 在 于 它 允 许 从 用 户 的 角度 来 对 程序 进行 分 段 ， 又 允许 从 系统 
的 角度 来 对 主 存 进 行 分 页 。 


6.6 存储 器 管理 实例 


由 于 Pentium 系列 机 在 现代 存储 器 管理 方面 表现 优异 ， 因 此 我 们 简要 介绍 这 种 处 理 器 是 如 
何 处 理 存储 器 的 。 

Pentium 架构 有 32 位 虚拟 地 址 和 32 位 物理 地 址 。 当 采用 分 页 管理 时 ， 页 的 大 小 可 以 是 
4KB 或 4MB。 分 页 和 分 段 有 不 同 的 组 合 形式 ， 包 括 不 分 段 不 分 页 存储 器 、 不 分 段 但 分 页 存储 
器 、 分 段 不 分 页 存储 器 ， 以 及 分 段 分 页 存储 器 。 

Pentium 有 Ll 和 L2 两 级 缓存 ， 块 大 小 都 是 32 字 节 。L1 靠近 处 理 器 ， [2 位 于 处 理 器 和 
存储 器 之 间 。L1 实际 包含 两 个 缓存 : Pentium 将 Ll 分 成 存放 指令 的 缓存 ( 叫 作 | -Cache ) 和 
存放 数据 的 缓存 ( 叫 作 D- Cache) 。 两 个 LI 缓存 都 采用 LRU 位 算法 来 处 理 块 的 蔡 换 ， 每 个 
Ll 有 一 个 TLB。D-Cache 的 TLB 有 64 行 记录 ， 而 I-Cache 的 TLB 只 有 32 行 。 两 个 TLB 都 采 
用 4 路 组 相 联 映射 并 使 用 伪 LRU 替换 算法 。L1 的 D- Cache 和 I-Cache 都 使 用 2 路 组 相 联 映 
射 。L2 缓存 的 容量 从 512KB( 早 期 模型 ) 增 加 到 1MB( 晚期 模型 )。L2 和 L1 一 样 ， 也 采用 2 





路 组 相 联 映射 。 
为 了 管理 对 存储 器 的 访问 ，Pentium 的 工 em 和 L2 缓存 采用 MESI 高 速 缓存 一 致 性 协议 。 
每 一 缓存 行 有 2 位 ， 存 储 如 下 MESI 状态 中 的 一 个 : (1)M: 修改 过 (表示 缓存 和 主 存 的 内 容 不 


同 ); (2)E: 独占 的 (缓存 未 被 修改 过 ， 让 其 则 各 样 ); (3)S: 共享 的 (此 行 / 块 可 以 
和 其 他 缓存 的 行 / 块 共享 ); (4)I: 无 效 的 (此 行 / 块 不 在 缓存 中 ) 。 图 6-29 给 出 了 Pentium 架构 
的 存储 器 层次 结构 。 

以 上 仅 对 Pentium 系列 机 及 其 存储 管理 方式 给 出 了 一 个 简要 且 基 本 的 概述 ， 如 果 您 对 细节 
感 兴趣 ， 请 查看 “扩展 阅读 ”部 分 。 
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LI 缓存: 2 路 组 相 联 映射 、 单 LRU 位 ， 行 大 小 为 32 字 节 


- 


or 


L1 的 I-Cache 
( 8KB 或 16KB ) 


LI 的 D-Cache 
( 8KB 或 16KB ) 





D-Cache TLB: I-Cache TLB: 
4 路 组 相 联 ，64 个 记录 4 路 组 相 联 ，32 个 记录 


图 6-29 ”Pentium 存储 器 的 层次 结构 





本 章 小 结 

存储 顺 是 按照 层次 结构 进行 组 织 的， 容量 大 的 存储 融 便 宜 但 速度 慢 ， 而 小 容量 的 存储 器 速度 更 快 但 
价格 也 更 贵 。 在 一 个 典型 的 存储 器 层次 结构 里 ,我 们 可 以 看 到 它 包 括 缓存 、 主 存 以 及 辅 存 ( 通常 是 磁 
盘 ) 。 局 部 性 原理 有 助 于 缩小 这 个 层次 中 相 邻 存储 器 之 间 的 速度 差异 ， 并 且 程 序 员 感觉 好 像 在 使 用 一 个 
非常 快速 上 且 大 容量 ， 而 不 用 管 在 不 同 层次 之 间 传 输 信息 的 细节 。 

缓存 起 着 缓冲 区 的 作用 ， 存 放 主 存 中 使 用 最 频繁 的 数据 块 ， 并且 它 离 CPU 很 近 。 存 储 器 层次 结构 的 
一 个 目标 就 是 使 处 理 器 的 有 效 访问 时 间接 近 于 缓存 的 访问 时 间 。 达 到 这 一 目标 取决 于 正在 执行 程序 的 特 
性 、 缓 存 的 大 小 和 组 织 ， 以 及 缓存 替换 策略 。 在 缓存 中 找到 的 处 理 咒 引用 叫 作 缓存 命中 ; 如 果 没 有 找到 ， 
则 被 称 为 缓存 失效 。 在 发 生 失 效 时 ， 缓 存 中 没有 的 数据 会 从 主 存 中 取出 来 ， 并 且 包 含 此 数据 的 整个 块 会 
装 入 到 缓存 中 。 统 一 缓存 中 包含 数据 和 指令 ， 而 哈佛 缓存 则 会 将 数据 和 指令 分 别 存 和 到 不 同 的 缓存 中 。 
为 了 提高 缓存 性 能 ， 会 使 用 多 级 缓存 结构 。 

缓存 的 组 织 决定 了 CPU 请 求 不 同 存储 器 地 址 时 查找 缓存 的 方法 。 可 以 用 不 同 的 方法 来 组 织 缓存 : 直 
接 映射 、 全 相 联 映射 或 者 组 相 联 映射 。 直 接 映射 缓存 不 需要 替换 算法 ; 但 是 ， 全 相 联 映射 和 组 相 联 映射 
必须 使 用 FIFO、LRU 或 者 其 他 替换 算法 来 决定 当 缓 存 已 满 时 ， 需 要 将 缓存 中 的 哪 一 个 块 移出 以 便 给 新 块 
让 出 地 方 。LRU 有 最 优 的 性 能 ， 但 是 很 难 实现 。 

存储 器 层次 结构 的 另 一 个 目标 是 通过 使 用 硬盘 来 扩展 主 存 空 间 ， 也 称 其 为 虚拟 存储 器 。 虚 拟 存储 器 
使 我 们 可 以 在 比 物理 空间 大 的 虚拟 地 址 空间 上 运行 程序 。 它 允许 同时 运行 多 个 程序 。 如 果 不 使 用 TLB 来 
缓存 最 近 经 常 使 用 的 虚拟 /物理 地 址 对 ， 则 虚拟 存储 器 的 缺点 包括 额外 资源 消耗 (存储 页 表 ) 和 额外 的 访 
存 时 间 ( 为 了 访问 页 表 ) 。 虚 拟 存储 器 在 将 虚拟 地 址 转换 为 物理 地 址 时 经 常会 引起 转换 惩罚 ， 而 当 所 请 求 
页 面 位 于 磁盘 上 而 非 主 存 时 ， 需 要 处 理 页 面 失效 ， 这 也 会 引起 惩罚 。 虚 拟 存储 器 和 主 存 之 间 的 关系 和 主 
存 与 缓存 之 间 的 关系 是 非常 相似 的 。 由 于 这 种 相似 性 ， 缓 存 的 概念 和 TLB 经 常 混淆 。 事 实 上 ，TLB 是 一 
个 缓存 。 了 解 在 做 其 他 任何 事情 之 前 要 首先 将 虚拟 地 址 转换 成 物理 地 址 是 很 有 必要 的 ， 而 这 正 是 由 TLB 
所 实现 的 。 尽 管 缓存 和 分 页 存储 器 看 上 去 很 相似 ， 但 它们 的 目的 不 同 : 缓存 改善 了 主 存 的 有 效 访问 时 间 ， 
而 分 页 扩展 了 主 存 的 容量 


扩展 阅读 
Mano( 2007) 的 著作 RAM 进行 了 完美 的 解释 。Stallings( 2013 ) 的 著作 也 对 RAM 进行 了 个 很 好 的 描述 。 
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Hamacher、Vranesic 和 Zaky(2002) 的 著作 包含 了 对 缓存 的 广泛 讨论 。 如 果 想 更 全 面 地 了 解 虚拟 存储 器 ， 
请 参考 Stallings(2012 ) 、Tanenbaum(2013 ) 或 者 Tanenbaum 和 Woodhull(2006 ) 的 著作 。 想 在 总 体 上 对 存储 
器 管理 有 更 多 的 了 解 ， 请 查阅 Flynn 和 McHoes(2010) 、Stallings(2013 ) 、Tanenbaum 和 Woodhull(2006 ) ， 
或 Silberschatz、Galvin 和 Gagne(2013 ) 的 著作 。Hennessy 和 Patterson(2012 ) 的 著作 讨论 了 包括 绥 存 性 能 在 
内 的 一 些 问题 。 关 于 存储 技术 的 在 线 教程 ， 请 看 网 址 www. kingston. com/tools/umg。George Mason 大 学 也 
对 各 种 计算 机 主题 有 一 系列 的 工作 台 。 网 址 cs. gmu. edu/cne/workbenches/vmemory. html 有 虚拟 存储 器 的 
工作 台 。 
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复习 题 

. SRAM 和 DRAM 哪 一 个 速度 更 快 ? 

. 用 DRAM 构成 主 存 有 哪些 优点 ? 

.举例 给 出 经 常 使 用 ROM 的 3 个 不 同 应 用 场合 。 

. 解释 存储 器 层次 结构 的 概念 ， 为 什么 作者 选择 用 金字 塔 结构 来 描述 它 ? 

. 解释 引用 局 部 性 的 概念 ， 并 陈述 其 对 存储 系统 的 重要 性 。 

. 局 部 性 的 3 种 形式 是 什么 ? 

. 给 出 两 个 不 是 在 计算 机 上 使 用 缓存 的 例子 。 

. Ll 和 L2 缓存 哪个 速度 快 ? 哪 个 容量 小 ?为 什么 小 ? 

. 缓存 由 它 的 。” 访问 ,而 主 存 由 它 的 访问 。 

10. 在 直接 映射 方式 中 ， 地 址 分 为 哪 3 个 字段 ”如 何 使 用 它们 来 访问 位 于 缓存 中 的 字 ? 

11. 相 联 存储 器 和 普通 存储 器 有 什么 不 同 ? 哪 种 更 昂贵 以 及 为 什么 ? 

12. 解释 全 相 联 映射 和 直接 映射 有 什么 不 同 。 

13. 解释 一 下 组 相 联 映射 是 如 何 结合 全 相 联 映射 和 直接 映射 思想 的 。 

14. 直接 映射 是 组 相 联 映射 当 组 大 小 为 1 时 的 一 个 特例 。 因 此 ， 全 相 联 映射 是 组 相 联 映射 当 组 大 小 
为 “时 的 一 个 特例 。 

15. 组 相 联 映射 中 的 地 址 格式 包含 哪 3 个 字段 ， 如 何 用 它们 来 访问 缓存 中 的 某 个 位 置 ? 

16. 解释 本 章 中 介绍 的 4 种 缓存 替换 策略 。 

17. 为 什么 最 优 蔡 换 算法 重要 ? 
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. 使 用 LRU 和 FIFO 替换 算法 时 ， 缓 存 的 什么 行为 会 导致 最 坏 的 情况 ? 
. 准确 解释 什么 是 有 效 访 问 时 间 ( EAT) 。 

. 解释 如 何 推 导 EAT 公式 。 

. 什么 时 候 缓存 的 表现 不 好 ? 

。 什么 是 脏 块 ? 

. 描述 两 种 缓存 写 策略 的 优 缺 点 。 

. 解释 统一 缓存 和 哈佛 缓存 之 间 的 区 别 。 

. 哈佛 缓存 的 优点 是 什么 ? 

. 为 什么 系统 要 包含 一 个 受害 者 缓存 、 一 个 跟踪 缓存 ? 
.解释 Ll1、L2 和 13 cache 之 间 的 区 别 。 

. 解释 包容 缓存 和 独占 缓存 之 间 的 区 别 。 

. 非 阻 塞 缓 存 的 优点 是 什么 ? 

. 虚拟 地 址 和 物理 地 址 的 区 别 是 什么 ”哪个 寻 址 空间 大 ? 为什么? 
. 分 页 的 目的 是 什么 ? 

. 讨论 分 页 的 优 缺 点 。 

. 什么 是 页 面 故障 ? 

. 什么 引起 了 内 部 碎片 ? 

. 虚拟 地 址 由 哪些 字段 组 成 ? 

.什么 是 TLB ， 以 及 它 是 如 何 改善 EAT 的 ? 

. 虚拟 存储 器 的 优 缺 点 是 什么 ? 

. 一 个 系统 什么 时 候 需要 分 页 它 的 页 表 ? 

. 什么 引起 了 外 部 碎片 ， 如 何 才能 修复 它 ? 


习题 


4 1. 


9 4. 


假设 某 台 计算 机 的 缓存 采用 直接 映射 方式 ， 主 存 采用 字 节 寻 址 ， 容 量 为 2” 字 节 ， 缓存 共有 32 个 块 ， 
每 块 有 16 字 节 。 

a) 主 存 中 共有 多 少 块 ? 

b) 通过 缓存 可 推导 出 主 存 的 地 址 格式 是 什么 形式 的 ， 也 就 是 说 ， 标 记 、 块 和 偏 移 的 位 数 各 是 多 少 ? 
c) 主 存 地 址 0x0DB63 映射 到 缓存 的 哪 一 块 ? 


. 假设 某 台 计算 机 的 缓存 采用 直接 映射 方式 ， 主 存 采用 字 节 寻 址 ， 容 量 为 2 字 节 ， 缓 存 共有 1024 个 块 ， 


每 块 有 32 个 字 节 。 

a) 主 存 中 共有 多 少 块 ? 

b) 通过 缓存 可 推导 出 主 存 的 地 址 格式 是 什么 形式 的 ， 也 就 是 说 ， 标 记 、 块 和 偏 移 的 位 数 各 是 多 少 ? 
c) 主 存 地 址 0x000063FA 映射 到 缓存 的 哪 一 块 ? 


. 假设 某 台 计算 机 的 缓存 采用 直接 映射 方式 ， 主 存 采 用 字 节 寻 址 ， 容 量 为 2” 字 节 ， 缓存 共有 512 块 ， 每 


块 包含 64 字 节 。 

a) 主 存 中 共有 多 少 块 ? 

b) 通过 缓存 可 推导 出 主 存 的 地 址 格式 是 什么 形式 的 ， 也 就 是 说 ,标记 、 块 和 偏 移 的 位 数 各 是 多 少 ? 

c) 主 存 地 址 0x13A4498A 映射 到 缓存 的 哪 一 块 ? 

假设 某 台 计算 机 的 缓存 采用 全 相 联 映射 方式 ， 主 存 采用 字 节 寻 址 ， 容 量 为 2" 字 节 ， 缓存 共有 64 个 块 ， 

每 块 有 32 字 节 。 

a) 主 存 中 共有 多 少 块 ? 

b) 通过 缓存 可 推导 出 主 存 的 地 址 格式 是 什么 形式 的 ， 也 就 是 说 ， 标 记 字 段 和 偏 移 地 址 的 位 数 各 是 
多 少 ? 

c) 主 存 地 址 0xF8C9 映射 到 缓存 的 哪 一 块 ? 


4 7.。 





. 假设 某 台 计算 机 的 缓存 采用 全 相 联 映射 方式 ， 主 存 采用 字 节 寻 址 ， 容 量 为 2 字 节 ， 缓 存 共有 128 个 


块 ， 每 块 有 64 字 节 。 

a) 主 存 中 共有 多 少 块 ? 

b) 通过 缓存 可 推导 出 主 存 的 地 址 格式 是 什么 形式 的 ， 也 就 是 说 ,标记 和 偏 移 的 位 数 各 是 多 少 ? 
c) 主 存 地 址 0x01D872 映射 到 缓存 的 哪 一 块 ? 


. 假设 某 台 计算 机 的 缓存 采用 全 相 联 映射 方式 ， 主 存 采 用 字 节 寻 址 ， 容 量 为 2* 字 节 ， 缓存 共有 128 块 ， 


每 块 有 64 字 节 。 

a) 主 存 中 共有 多 少 块 ? 

b) 通过 缓存 可 推导 出 主 存 的 地 址 格式 是 什么 样 的 ， 也 就 是 说 ， 标 记 和 偏 移 的 位 数 各 是 多 少 ? 

c) 主 存 地 址 0x01D872 映射 到 缓存 的 哪 一 块 ? 

( 译 者 注 : 原 书 第 6 题 与 第 5 题 完全 相同 ， 为 了 不 影响 正文 的 引用 ， 故 保留 原 题 。) 

假设 某 系统 的 主 存 容量 为 128M 字 节 ， 每 块 大 小 为 64 字 节 ， 并 且 缓 存 包 含 32K 个 块 。 在 2 路 组 相 联 映 
射 方式 下 给 出 采用 字 节 寻 址 时 主 存 地 址 的 格式 。 注 意 要 给 出 各 个 字段 的 名 称 和 大 小 。 


. 某 个 2 路 组 相 联 映射 缓存 包含 4 个 组 ， 主 存 共 有 2k 个 块 ， 每 块 有 8 字 节 ,并且 主 存 采用 字 节 寻 址 。 


a) 给 出 主 存 的 地 址 格式 ， 要 求 它 能 将 主 存 地 址 映射 到 缓存 。 确 保 包 含 各 字段 的 名 称 和 大 小 。 
b) 某 程序 存放 在 主 存 地 址 0x8 ~0x33 中 ， 循 环 执行 3 次 时 ， 计 算命 中 率 。 此 时 ， 你 可 以 认为 命中 率 基 
于 一 小 片 时 间 段 。 


. 假设 某 台 使 用 字 节 寻 址 的 计算 机 采用 组 相 联 映射 缓存 ， 主 存 共有 2" 字 节 ,缓存 共有 32 个 块 ， 每 块 8 


字 节 。 

a) 若 缓存 采用 2 路 组 相 联 映射 则 主 存 的 地 址 格式 是 什么 样 的 ?请 给 出 标记 、 组 和 偏 移 字段 的 
位 数 。 

b) 若 缓存 采用 4 路 组 相 联 映射 则 主 存 的 地 址 格式 是 什么 样 的 ? 请 给 出 标记 、 组 和 偏 移 字 段 的 
位 数 。 


10. 假设 某 台 使 用 字 节 寻 址 的 计算 机 采用 组 相 联 映射 缓存 ， 主 存 共有 2” 字 节 ， 缓 存 共 有 64 个 块 ， 每 块 4 


*]11. 


字 节 。 

a) 若 缓存 采用 2 路 组 相 联 映射 则 主 存 的 地 址 格式 是 什么 样 的 ? 请 给 出 标记 、 组 和 偏 移 字 段 的 位 数 。 
b) 若 缓 存 采 用 4 路 组 相 联 映射 ， 则 主 存 的 地 址 格式 是 什么 样 的 ?请 给 出 标记 、 组 和 偏 移 字 段 的 位 数 。 
假设 某 台 计算 机 的 主 存 地址 共有 8 位 ,缓存 共有 16 个 块 ， 每 个 缓存 块 包含 4 字 节 ,计算 机 在 执行 程 
序 时 ,访问 了 多 个 主 存 地 址 。 假 设 此 计算 机 采用 直接 映射 方式 ,缓存 看 到 的 主 存 地 址 格式 如 下 : 


te 
EEC 


系统 以 下 列 顺序 访问 主 存 : 0x6E、0xB9、0xl17 、0xE0 、0x4E、0x4F、0x50 、0x91 、0xA8 、0xA9 、 
0xAB、0xAD、0x93 和 0x94。 前 4 次 访问 主 存 地 址 的 内 容 已 经 调 入 到 缓存 ， 如 下 图 所 示 。( 标 记 中 的 
内 容 以 二 进 制 格式 显示 ， 缓存“ 内容” 简单 地 以 存储 在 该 位 置 的 主 存 地 址 来 显示 。) 

标记 缓存 内 容 标记 缓存 内 容 
内 容 ( 用 地 址 表示 ) 内 容 ( 用 地 址 表示 ) 








块 2 肥 


a) 当 按 上 述 地 址 序列 访问 主 存 时 ,命中 率 是 多 少 ? 假设 前 4 次 访问 都 为 失效 。 
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b) 在 完成 最 后 一 次 访问 后 ,缓存 中 存放 的 是 哪些 主 存 块 ? 

12. 某 给 定 的 存储 器 容量 为 256 字 节 ， 采 用 字 节 寻 址 ， 假 设 一 次 内 存 转 储 输 出 的 结果 如 下 表 所 示 。 每 一 个 
存储 单元 的 地 址 由 其 所 在 行 、 列 决定 。 比 如 说 ， 内 存 地 址 0x97 在 第 9 行 7 列 ,并且 其 中 存储 的 是 十 
六 进 制 值 43 ， 地 址 0xA3 存储 的 是 十 六 进 制 值 58。 在 这 次 转 储 系统 中 ， 产 生 的 缓存 容量 是 4 个 块 ， 每 
块 包含 8 字 节 。 假 设 对 如 下 序列 的 内 存 地 址 进行 访问 : 0x2C、0x6D、0x86、0x29 、0xA5 、0x82 、 
0xA7 、0x68 、0x80 和 0x2B。 






















































































a) 主 存 中 共有 多 少 个 块 ? 
b) 假设 缓存 采用 直接 映射 方式 : 
中 给 出 主 存 地 址 格式 ， 指 定 字段 名 称 和 大 小 。 
@ 在 访问 主 存 10 次 后 ， 缓 存 的 存储 情况 如 何 ? 画 出 缓存 ， 并 显示 内 容 和 标记 字段 。 
@@ 对 于 给 定 的 地 址 序列 ， 缓 存 的 命中 率 是 多 少 ? 
c) 假设 缓存 采用 全 相 联 映射 方式 : 
给 出 主 存 地 址 格式 ， 指 定 字段 名 称 和 大 小 。 
@) 假 设 缓存 块 初始 为 空 ， 首 先 调 入 第 一 个 可 用 的 空 块 ， 并 使 用 FIFO 替换 策略 ,那么 在 完成 对 内 存 
地 址 的 10 次 访问 后 ， 绥 存 的 存储 情况 如 何 ? 
@ 对 给 定 的 地 址 序列 ， 缓 存 的 命中 率 是 多 少 ? 
d) 假设 缓存 采用 2 路 组 相 联 映射 方式 : 
给 出 主 存 地 址 格式 ， 指 定 字 段 名 称 和 大 小 。 
@ 对 内 存 地 址 进行 10 次 访问 后 ,缓存 的 存储 情况 如 何 ? 
@ 对 于 给 定 的 地 址 序列 ， 缓 存 的 命中 率 是 多 少 ? 
@ 假 设 在 缓存 命中 时 访问 数据 需要 5ns， 从 主 存 中 获取 数据 所 需 时 间 为 25ns， 则 缓存 的 平均 有 效 
访问 时 间 是 多 少 ? 假设 所 有 的 内 存 访问 对 给 定 的 10 个 地 址 均 有 相同 的 命中 率 ， 并 且 假 设 系统 使 
用 顺序 访问 策略 。 

13. 某 直接 映射 缓存 包含 8 个 块 。 主 存 采用 字 节 寻 址 ， 共 包含 4K 个 块 ， 每 块 有 8 字 节 。 缓 存 的 访问 时 间 
为 22ns， 从 内 存 填充 缓存 槽 需要 用 时 300ns。( 这 个 时 间 段 ， 可 以 确定 块 的 失效 并 将 其 传送 到 缓存 
中 。) 假 设 数据 请 求 对 缓存 和 主 存 总 是 并 行 开 始 的 (因此 ， 如 果 在 缓存 中 未 找到 ， 也 不 用 将 缓存 的 查找 
时 间 累 加 到 对 主 存 的 访问 上 )。 如 果 某 块 不 在 缓存 中 ， 则 整个 块 会 调 入 主 存 并 重启 访问 过 程 。 缓 存 初 
始 时 为 空 。 

a) 给 出 能 够 将 主 存 地 址 映射 到 缓存 的 主 存 地 址 格式 ， 确 保 包 含 字 段 名 称 和 大 小 。 
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14. 


5. 


16. 


17. 


18. 


20. 


b) 当 一 个 程序 4 次 循环 访问 从 0x0 ~0x43 的 主 存 地 址 时 ， 计 算 程序 的 命中 率 。 
c) 计算 这 个 程序 的 有 效 访问 时 间 。 


假设 某 台 字 节 寻 址 计算 机 共有 24 位 地 址 ， 缓 存 能 存储 总 共 64KB 的 数据 ， 每 块 有 32 字 节 。 给 出 采用 
以 下 映射 方案 时 的 主 存 地 址 格式 : 

a) 直接 映射 

b) 全 相 联 映射 

c) 4 路 组 相 联 映射 


假设 某 台 使 用 字 节 寻 址 的 计算 机 采用 4 路 组 相 联 映射 ， 并且 主 存 有 2" 个 字 ( 每 一 个 字 32 位 ), 缓存 有 
32 个 块 ， 每 块 4 个 字 。 给 出 该 机 的 主 存 地 址 格式 。( 提示: 由 于 此 架构 采用 字 节 寻 址 ， 所 以 地 址 个 数 
对 地 址 格式 很 关键 ,你 必须 将 每 一 项 都 转换 为 字 节 ,) 

假设 某 直接 映射 的 缓存 容量 为 4096 字 节 ， 每 一 块 16 字 节 。 假 设 地 址 32 位 ， 缓 存 初 始 为 空 ， 请 填充 
下 表 。( 所 有 空白 处 均 可 用 十 六 进 制 表示 )。 如 果 一 个 接 一 个 地 访问 这 些 地 址 ， 那 么 请 指出 如 果 有 的 
话 ， 则 哪个 地 址 会 引起 冲突 ( 迫使 刚 调 入 缓存 的 块 重 写 ) 。 

地 址 标记 缓存 位 置 ( 块 ) 偏 移 
OxOFFOFABA 


0x00000011 | 
OxOFFFFFFE | | 














0x23456719 | | 
0xCAFEBABE 








假设 缓存 采用 16 路 组 相 联 映 射 ， 请 重 做 习题 16。 


邮 址 : 标记 缓存 位 置 ( 块 ) 偏 移 
OxOFFOFABA 
0x00000011 | 
OxOFFFFFFE 
0x23456719 


OxCAFEBABE 
假设 某 进 程 的 页 表 记 录 如 下 表 。 使 用 图 6-22a 所 示 的 格式 ， 请 问 进 程 页 存放 在 主 存 的 什么 位 置 ? 


| 有效 位 | 

































. 假设 某 进程 的 页 表 记 录 如 下 表 。 使 用 图 6-22a 所 示 的 格式 ,请问 进程 页 存放 在 主 存 的 什么 位 置 ? 


| 








假设 某 虚拟 存储 系统 采用 字 节 寻 址 方式 ， 共 有 8 个 虚拟 页 ， 每 页 64 字 节 ， 并 有 4 个 页 面 ， 假 设 页 表 
如 下 ， 请 回答 下 列 问 题 : 
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加 大 


当 
间 


\= 


: 


wwb 一 一 李 





Ee 
| 
ED | 
sa 
| 
| 
| | 
P| 


a) 虚拟 地 址 有 多 少 位 ? 
b) 物理 地 址 有 多 少 位 ? 
c) 以 下 的 虚拟 地 址 对 应 的 物理 地 址 是 多 少 ?〈 如 果 地 址 引起 了 页 面 失效 ， 只 要 说 明 这 种 情况 即 可 。) 
(DOx0 
(20x44 
CGO0xC2 
(DOx80 
假设 有 一 个 容量 为 2" 字 节 的 虚拟 存储 器 和 一 个 容量 为 2 字 节 的 物理 主 存 。 假 设 页 大 小 为 2 字 节 。 
a) 虚拟 存储 器 中 有 多 少 页 ? 
b) 物理 内 存 中 有 多 少 个 页 面 ? 
c) 如 果 一 个 进程 占 满 了 虚拟 存储 器 ， 则 在 它 的 页 表 中 共有 多 少 行 记录 ? 
已 知 有 一 个 字 节 寻 址 的 虚拟 存储 器 系统 ， 使 用 有 两 条 记录 的 TLB，2 路 组 相 联 映射 的 高 速 缓存 ， 以 及 
对 应 进程 P 的 页 表 。 假 设 缓存 的 每 一 块 都 是 8 字 节 ， 页 大 小 为 16 字 节 。 在 如 下 系统 里 ， 主 存 被 分 成 
若干 块 ， 每 一 个 块 都 用 一 个 字母 表示 。 两 个 块 的 大 小 等 于 一 帧 。 


页 ”页 面 标记 数据 ”标记 数据 
虹 豆 组 [| oo| c ol ; 
组 1 Dp Ro] H | 2 
缓存 3 
4 
5 
6 
页 面 块 可 
0 8 
0 
1 { 2 10 
3 11 
4 12 
2{ 5 13 
Bb 6 14 
-| 有 15 
P 的 虚拟 存储 器 





若 给 定 系统 的 状态 如 上 图 所 示 ， 试 回答 以 下 问题 : 

a) 进程 P 的 虚拟 地 址 共有 多 少 位 ? 请 解释 。 

b) 物理 地 址 有 多 少 位 ? 请 解释 。 

c) 给 出 虚拟 地 址 0x12 的 地 址 格式 (指出 字段 名 称 和 大 小 ) ， 系 统 将 这 个 地 址 转换 为 物理 地 址 。( 提示 : 
将 虚拟 地 址 转换 为 二 进 制 形 式 并 将 其 分 解 为 相应 字段 。) 解 释 这些 字 段 是 如 何 转换 到 对 应 物理 地 址 的 。 

d) 给 定 虚拟 地 址 0x06 ， 它 可 转换 为 物理 地 址 0x36。 给 出 物理 地 址 的 格式 (指明 字段 名 称 和 大 小 ) ， 根 
据 这 个 物理 地 址 可 以 决定 该 地 址 对 应 存放 的 缓存 位 置 。 解 释 如 何 使 用 这 个 地 址 格式 来 决定 物理 地 
址 0x36 存放 在 缓存 中 的 位 置 。( 提示: 将 0x36 转换 为 二 进 制 格式 并 分 解 为 相应 字段 。) 

e) 给 定 的 虚拟 地 址 0x19 位 于 虚 页 1， 偏 移 量 为 9。 准确 说 明 这 个 地 址 如 何 转换 为 对 应 的 物理 地 址 ， 





23. 


只 


“2 


*28. 


29. 
. 查看 某 一 供应 商 的 存储 器 说 明 书 ， 并 给 出 存储 器 访问 时 间 、 缓 存 访问 时 间 以 及 缓存 命中 率 ( 以 及 供应 


以 及 如 何 访 问 数据 。 在 你 的 解释 中 ， 要 包含 TLB、 页 表 、 缓 存 和 内 存 是 如 何 使 用 的 。 
一 个 虚拟 存储 系统 带 TLB、 缓 存 和 一 个 页 表 ， 有 如 下 假设 : 
一 次 TLB 命中 需要 5ns。 
一 次 缓存 命中 需要 12ns。 
一 次 存储 器 引用 需要 25ns。 
一 次 磁盘 引用 需要 200ms( 包括 更 新 页 表 ， 缓存 和 TLB 的 时 间 ) 。 
TLB 的 命中 率 为 90% 。 
缓存 的 命中 率 为 98% 。 
页 面 失效 率 为 0. 001% 。 
在 一 次 TLB 或 缓存 失效 时 ,访问 时 间 包 括 一 次 TLB 和 缓存 更 新 时 间 ， 但 是 无 须 重启 访问 。 
对 于 一 次 页 面 失效 ， 需 要 从 磁盘 中 取出 页 ， 并 实现 所 有 更 新 ， 但 是 无 须 重启 访问 。 
所 有 的 访问 都 是 顺序 进行 (没有 重合 ， 没 有 并 行 完成 情况 ) 的 。 
对 以 下 每 一 种 情况 ， 指 出 它 是 可 能 还 是 不 可 能 发 生 的 。 如 果 可 能 的 话 ， 给 出 访问 到 请 求 数据 所 需要 
的 时 间 。 
a) TLB 命中 ,缓存 命中 
b) TLB 失效 ， 页 表 命 中 ， 缓 存 命中 
c) TLB 失效 ， 页 表 命 中 ,缓存 失效 
d) TLB 失效 ， 页 表 失 效 ， 缓存 命中 
e) TLB 失效 ， 页 表 失 效 
写 出 计算 有 效 访 问 时 间 的 公式 。 


. TLB 失效 总 是 意味 着 某 一 页 不 在 主 存 中 吗 ? 解释 原因 。 
. 一 个 系统 对 使 用 一 级 页 表 的 进程 实现 了 分 页 虚拟 地 址 空间 。 虚 拟 空间 最 大 为 16MB。 正 在 执行 进程 的 


页 表 包 括 以 下 有 效 记录 (箭头 一 表示 某 一 个 虚 页 映射 到 给 定 的 页 面 ， 也 就 是 说 ， 位 于 那个 页 面 ) : 
虚 页 2 一 页 面 4 虚 页 4 一 页 面 9 

虚 页 1 一 页 面 2 虚 页 3 一 页 面 16 

虚 页 0 一 页 面 1 

页 大 小 为 1024 字 节 ， 机 器 的 最 大 物理 内 存 为 2MB。 

a) 每 一 个 虚拟 地 址 需要 多 少 位 ? 

b) 每 一 个 物理 地 址 需要 多 少 位 ? 

c) 页 表 中 最 大 的 记录 数 是 多 少 ? 

d) 虚拟 地 址 0x5F4 将 转换 为 哪个 物理 地 址 ? 

e) 哪个 虚拟 地 址 会 转换 为 物理 地 址 0x400? 


. a) 如 果 你 是 一 个 计算 机 制造 者 ， 为 了 使 你 的 系统 有 尽 可 能 大 的 价格 竞争 力 ， 你 会 为 它 的 存储 器 层次 


结构 选择 哪 种 特征 和 组 织 方式 ? 

b) 如 果 你 是 计算 机 购买 者 ， 为 了 从 系统 中 获取 最 好 的 性 能 ， 那 么 你 对 它 的 存储 器 层次 结构 中 哪些 特 
征 最 感 兴趣 ? 

考虑 某 多 处 理 器 系统 ， 每 个 处 理 器 都 有 自己 的 缓存 , 但 是 所 有 处 理 器 共享 主 存 。 

a) 你 将 使 用 何 种 缓存 写 策 略 ? 

b) 缓存 一 致 性 问题 。 对 于 上 述 系统 ， 如 果 一 个 处 理 器 在 缓存 中 有 内 存 块 A 的 备份 ， 并 且 第 二 个 处 理 
器 也 在 缓存 中 有 内 存 块 A 的 备份 ， 则 在 主 存 中 更 新 块 A 会 引起 什么 问题 ? 你 能 想 一 种 办 法 (或 者 
更 多 ) 来 阻止 这 种 情况 的 发 生 或 减轻 它 的 后 果 吗 ? 

给 出 一 个 特定 的 结构 (不 是 本 章 中 介绍 过 的 ) 。 研 究 它 并 找 出 此 结构 是 如 何 实现 本 章 所 介绍 的 这 些 概 

念 的 ， 就 像 Intel 的 Pentium 处 理 器 一 样 。 

作为 一 个 程序 员 ， 说 出 两 种 你 能 改进 缓存 性 能 的 方法 。 


商 提 供 的 其 他 数据 ) 。 
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7。 1 , 引 吾 


很 容易 看 出 ， 把 计算 机 当 作 一 种 存储 和 检索 信息 的 设备 比 把 它们 作为 计算 工具 更 加 有 用 。 
实际 上 ， 如 果 没 有 从 计算 机 中 获取 和 输入 数据 的 方法 ,那么 CPU 和 内 存 的 用 途 也 会 很 小 。 只 
有 通过 IO 设备 将 它们 连接 起 来 ， 才 能 使 各 部 件 进行 交互 。 

以 个 人 计算 机 系统 为 例 ， 鼠 标 和 键盘 是 用 户 的 主要 输入 设备 。 标 准 显示 需 是 一 种 只 向 用 户 
呈现 结果 的 输出 设备 。 尽 管 大 多 数 的 打印 机 将 设备 状态 信息 提供 给 所 连接 的 主机 系统 ， 但 它们 
仍 被 认为 是 一 种 输出 设备 。 磁 盘 驱动 器 因为 其 数据 可 以 写 人 和 读 取 ， 所 以 被 称 为 输入 /输出 设 
备 。 输 入 /输出 (10) 设 备 还 与 主机 系统 交换 控制 和 状态 信息 。 我 们 发 现 VO 这 个 术语 既 可 作 
为 形容 词 也 可 作为 名 词 来 使 用 : 计算 机 与 VO 设备 相连 接 ， 为 了 达到 良好 的 性 能 ， 需 要 使 对 磁 
盘 的 读 写 率 达到 最 小 。 

读 完 本 章 后 ， 你 会 了 解 输入 、 输 出 及 LO 设备 与 主机 系统 进行 交互 的 更 多 细节 ， 以 及 各 种 
LO 的 控制 方式 。 我 们 还 会 讨论 海量 存储 设备 的 内 部 细节 和 它们 在 大 型 计算 机 系统 上 的 工作 原 
理 和 方式 。 尽 管 企业 级 存储 系统 的 很 多 想法 也 包含 在 本 章 中 ,但 它们 还 依赖 于 数据 网 络 基 础 设 
施 。 因 此 ， 我 们 将 存储 系统 的 讨论 放 到 第 13 章 。 


7.2 1/O 及 其 性 能 

每 个 人 都 希望 计算 机 系统 能 够 有 效 地 存储 和 检索 数据 ， 并 迅速 执行 我 们 的 命令 。 当 这 一 过 
程 的 时 间 超 过 了 用 户 的 “思考 时 间 ” 时 ,我 们 会 抱怨 计算 机 “ 慢 "。 有 时 这 种 缓慢 可 能 会 对 生 
产 力 产生 巨大 的 影响 ， 这 种 影响 的 程度 可 以 用 金钱 来 衡量 。 通 常 来 说 ， 这 种 问题 的 根源 不 是 处 
理 器 或 内 存 ， 而 是 系统 如 何 处 理 它 的 输入 和 输出 (CO) 。 

LO 不 只 是 用 来 存储 文件 和 信息 检索 的 。 一 个 性 能 不 佳 的 输入 /输出 系统 可 能 会 导致 连锁 
反应 ， 并 拖累 整个 计算 机 系统 。 在 前 面 的 章节 中 ， 我 们 介绍 了 虚拟 存储 器 ， 也 就 是 解释 了 系统 
如 何 利 用 磁盘 对 存储 器 中 的 数据 块 进行 分 页 ， 以 便 在 主 存 中 为 更 多 的 用 户 进程 腾 出 空间 。 如 果 
磁盘 系统 的 速度 很 慢 ， 那 么 进程 执行 的 速度 也 会 减 慢 ， 由 此 导致 在 CPU 和 磁盘 队列 中 积压 很 
多 未 执行 的 任务 。 解 决 这 个 问题 最 简单 的 办 法 是 增加 更 多 的 系统 资源 。 例 如 ， 购 买 更 大 的 主 存 
设备 ， 更 快 的 处 理 器 。 如 果 在 增加 系统 资源 方面 受到 限制 ， 则 可 以 简单 地 限制 计算 机 中 并 发 执 
行 的 进程 数量 。 

采用 这 些 简单 的 解决 方案 难免 会 造成 系统 资源 的 浪费 。 当 我 们 真正 地 理解 了 计算 机 系统 的 
工作 过 程 后 ， 就 可 以 最 有 效 地 利用 现 有 的 系统 资源 ， 并 且 只 是 在 真正 需要 的 时 候 才 会 添加 昂贵 
的 资源 。 我 们 可 以 用 一 些 工具 来 找到 提高 性 能 最 有 效 的 方法 。 阿 姆 达尔 定律 就 是 其 中 之 一 。 


7.3 阿 姆 达 尔 定律 
每 次 (特殊 情况 除外 ) 微 处 理 器 公司 宣布 其 最 新 最 好 的 CPU 时 ， 全 球 各 地 的 头条 都 会 聚焦 


这 次 最 新 的 技术 跨越 。 世 界 各 地 的 计算 机 权威 人 士 也 认为 这 样 的 进步 是 值得 称赞 和 炫耀 的 。 然 
而 ， 当 VO 领域 取得 相同 的 技术 进步 时 ， 这 些 新 闻 通 常会 出 现在 某 些 不 知名 科技 期 刊 的 某 页 
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上 。 在 媒体 的 炒作 下 ,计算机 系统 的 整体 特性 很 容易 被 忽视 。 很 明显 ， 在 计算 机 中 一 个 部 件 的 
速度 提升 40% ， 肯 定 不 会 使 整个 系统 的 速度 提高 40% ， 然 而 ， 媒 体 的 宣传 效果 却 常常 会 给 读 
者 造成 一 种 相反 的 错觉 。 
1967 年 ， 阿 姆 达尔 发 现 了 计算 机 的 组 成 部 件 与 计算 机 系统 整体 效率 之 间 的 联系 。 他 把 这 
个 观察 量化 成 一 个 公式 ， 也 就 是 如 今 我 们 熟知 的 阿 姆 达尔 定律 。 在 本 质 上 ， 阿 姆 达尔 定律 指出 
了 计算 机 系统 整体 性 能 的 速度 提升 ( 称 为 加 速 比 ) 取决 于 某 个 特定 部 件 的 加 速 比 和 该 部 件 在 系 
统 中 的 使 用 率 。 相 关公 式 如 下 : 
| 
et 
式 中 ,5 代表 系统 整体 性 能 的 加 速 比 ; 表示 由 较 快 部 件 完成 的 部 分 ; 大 是 新 部 件 的 加 速 比 。 
假设 在 你 的 大 部 分 日 常 处 理工 作 中 计算 机 需要 花费 70% 的 时 间 来 执行 CPU 操作 ，30% 的 时 
间 花 费 在 磁盘 等 待 服务 上 。 假 设 现在 有 人 试图 向 你 出 售 一 个 比 现 有 处 理 器 快 50% 的 处 理 器 阵列 ， 
价格 是 10000 美元 。 而 就 在 前 一 天 ， 有 人 打 电话 向 你 推销 一 组 价值 7000 美元 的 磁盘 驱动 器 。 他 承 
诺 这 个 新 式 磁盘 系统 比 你 现 有 的 磁盘 速度 快 150% 。 由 于 你 很 清楚 自己 的 计算 机 性 能 开始 下 降 ， 
因此 需要 进行 一 些 尝试 。 你 会 选择 哪 一 种 作为 改善 性 能 的 最 好 方式 并 且 花 费 资金 最 少 ? 
如 果 选 择 升级 处 理 器 ， 则 计算 得 出 


关公 0 六 三 让 全 泌 席 六 二 . 


CT 0 
我 们 最 终 能 够 使 整体 加 速 比 达到 之 前 的 1.3 倍 ， 也 就 是 说 新 处 理 器 花费 了 10 000 美元 提高 了 
30% 的 整体 速度 。 

如 果 选 择 升 级 磁盘 ， 则 计算 得 出 : 


f=0.30,k =2.5, 所 以 S = 


1;30 





1 
Cl 
升级 磁盘 驱动 器 使 整体 速度 达到 之 前 的 1. 22 倍 ， 也 就 是 说 花费 7000 美元 提高 了 22% 的 整体 速度 。 

这 两 种 选择 方案 的 效果 几乎 是 一 样 的 ， 这 是 一 个 严谨 的 结论 。 处 理 器 每 提升 1% 的 性 能 ， 
成 本 约 为 333 美元 ; 磁盘 每 提升 1% 的 性 能 ， 成 本 约 为 318 美元 。 仅 基于 提升 每 个 百分点 性 能 
的 花费 上 看 ， 提 升 磁 盘 性 能 看 起 来 是 一 个 稍微 好 一 点 的 选择 。 当 然 ， 其 他 因素 也 会 影响 你 的 决 
定 。 例 如 ， 如 果 你 的 磁盘 已 经 接近 其 预期 寿命 ， 或 者 磁盘 运行 空间 不 足 ， 即 使 它 的 成 本 超过 处 
理 器 升级 成 本 ， 你 也 可 能 会 选择 磁盘 升级 。 

在 决定 升级 磁盘 之 前 ， 你 最 好 了 解 清楚 其 他 选择 方案 。 后 续 的 章节 将 有 助 于 我 们 了 解 通用 
的 输入 输出 (0) 系统 架构 ， 并 特别 强调 有 关 磁 盘 的 IO 系统 架构 。 磁 盘 的 IO 系统 紧 随 在 
CPU 和 内 存 之 后 决定 着 整个 计算 机 系统 的 效率 。 
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我 们 如 何 真正 定义 “加 速 比 ” 的 含义 ? 





阿 姆 达 尔 定律 使 用 变量 天 代表 一 个 特定 部 件 的 加 速 比 。 但 是 ， 我 们 对 于 “加 速 比 ”真正 的 
定义 是 什么 ? 

有 许多 不 同 的 方式 来 讨论 “加 速 比 ”的 概念 。 例 如 ， 一 个 人 可 能 说 A 的 速度 是 B 的 两 倍 ; 
另 一 个 人 可 能 会 说 A 的 速度 比 B 快 一 倍 。 如 果 想 使 用 阿 姆 达尔 定律 ， 理 解 这 两 种 说 法 间 的 差 
异 是 非常 重要 的 。 

一 种 常见 的 误解 是 认为 A 的 速度 是 B 的 两 倍 等 同 于 A 的 速度 比 B 的 快 200% ， 然 而 这 样 是 
不 准确 的 。 很 容易 看 出 ， 如 果 A 的 速度 是 B 的 两 倍 ， 那 么 指 的 是 倍数 为 2。 又 例如 ， 如 果 鲍 亏 
跑 一 圈 用 13s， 但 苏 珊 需要 30s， 显 然 鲍 勃 的 速度 是 苏 珊 的 两 倍 。 如 果 鲍 勃 的 平均 速度 为 每 
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4mile/h， 那 么 苏 珊 的 平均 速度 必定 是 2mile/h。 在 把 它 转化 成 百分比 时 就 会 发 生 错误 。 鲍 勃 的 
速度 并 不 是 在 苏 珊 的 速度 上 增加 了 200% ， 只 是 增加 了 100% 。 这 会 使 得 我 们 在 定义 快 百 分 之 
多 少 的 时 候 更 加 清晰 。 
B 间 N 
和 出 日 泪 N 护 ,大 陈 着 民 所 用 时间 =+ 
因此 ， 鲍 勃 比 苏 珊 的 速度 快 100% ,这 是 因为 30/15 =1+100A100(N 必须 是 100) 。 鲍 勃 与 苏 珊 
所 用 时 间 比 (30Z15 ) 表示 加 速 比 ( 鲍 勃 比 苏 珊 快 两 倍 ) 。 加 速 比 这 个 概念 ， 在 阿 姆 达 尔 方 程 中 用 
上 来 表示 ; 这 一 概念 也 是 由 于 应 用 阿 姆 达尔 定律 而 产生 的 。 
我 们 希望 使 用 阿 姆 达 尔 定 律 来 找到 对 系统 全 面 提速 的 方法 。 假 设 更 换 CPU， 我 们 知道 现 有 
的 CPU 使 用 了 80% 的 时 间 ， 而 我 们 正在 考虑 的 新 处 理 器 比 现 有 CPU 在 当前 系统 中 的 运行 速度 
快 50% 。 阿 姆 达尔 定律 要 求 我 们 知道 新 组 件 的 加 速 比 。 在 这 种 情况 下 ， 变 量 左 不 是 50 或 0.5， 
而 是 1.5( 因 为 新 处 理 器 比 旧 处 理 器 快 1.5 倍 ): 
旧 CPU 使 用 的 时 间 _ | ， 50 














新 CEU 使 用 的 时 间 = 工 +100 = 工 > 
所 以 ， 根 据 阿 姆 达尔 定律 ， 我 们 得 到 : 
1 
1.36 


人 
这 意味 着 整体 上 有 一 个 1.36 的 加 速 比 ; 更 换 新 CPU 的 系统 是 原来 速度 的 1.36 倍 ， 即 比 旧 系统 
快 36% 。 

除了 用 于 硬件 加 速 以 外 ， 阿 姆 达尔 定律 还 可 用 于 编程 。 众 所 周知 ， 平 均 说 来 每 个 程序 经 常 
会 将 大 部 分 时 间 都 花费 在 一 段 很 小 的 代码 中 。 程 序 员 通常 会 把 重点 放 在 提高 那 一 小 段 代 码 的 性 
能 上 。 他 们 可 以 使 用 阿 姆 达 尔 定律 来 确定 程序 在 运行 时 间 上 的 整体 效果 。 

假设 你 已 经 编写 了 一 个 程序 ， 并 且 确 定 有 80% 的 时 间 花 费 在 某 一 代码 段 中 。 你 检查 代码 
并 确定 可 以 减少 这 段 代 码 一 半 ( 即 加 速 比 为 2) 的 运行 时 间 。 如 果 我 们 使 用 阿 姆 达 尔 定律 ， 会 看 
到 它 对 于 整体 程序 的 影响 : 

1 
rT 
这 意味 着 由 于 使 用 了 新 代码 ， 整 个 程序 的 运行 速度 将 提高 1. 67 倍 。 

最 后 一 个 例子 。 作 为 一 个 程序 员 ， 你 可 以 选择 占 运行 时 间 10% 的 代码 段 提高 100 倍 的 速度 。 
估计 这 会 消耗 一 个 月 (时 间 和 工资 ) 的 成 本 来 重 写 代码 。 你 也 可 以 让 它 快 100 万 倍 ， 但 估计 这 会 花 
费 你 6 个 月 的 时 间 。 你 应 该 怎么 做 ? 如 果 使 用 阿 姆 达 尔 定律 ， 我 们 可 以 看 到 加 速 100 倍 会 产生 : 

1 
”1 
因此 ， 整 个 程序 的 加 速 比 为 1.1( 大 约 为 11% ) 。 如 果 我 们 花费 6 个 月 的 时 间 来 提高 性 能 的 100 
万 倍 ， 则 整个 程序 的 执行 加 速 比 是 : 


S 


167 











3 = 1. 1098 





1 
~ (1 -0.1) +1/1 000000 


增加 的 速度 非常 小 ， 所 以 能 够 看 出 花 额 外 的 时 间 和 工资 来 提高 这 段 代码 的 性 能 是 不 可 取 的 。 从 
事 并 行 编程 的 程序 员 经 常 运 用 阿 姆 达 尔 定律 来 确定 代码 并 行 化 的 好 处 。 

阿 姆 达 尔 定律 应 用 于 计算 机 硬件 和 软件 的 许多 领域 ,包括 通用 编程 、 存 储 器 层次 结构 设 
计 、 醒 件 更 换 、 处 理 器 集 设 计 、 指 令 集 设计 和 并 行 编程 。 然 而 ， 阿 姆 达尔 定律 对 于 服从 收益 说 
减 概念 的 任何 活动 都 是 非常 重要 的 ; 甚至 企业 管理 者 在 开发 或 比较 各 种 业务 流程 时 也 会 用 到 阿 
姆 达尔 定律 。 

在 你 做 出 购买 磁盘 的 决定 之 前 ,无 论 如 何 都 需要 知道 自己 的 选择 。 下 面 的 章节 将 帮助 你 理 


= 1;1111 
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解 通用 的 IO 体系 结构 ， 特 别 是 磁盘 IO 问题 。 在 确定 计算 机 系统 的 整体 有 效 性 时 ,磁盘 LO 
的 影响 仅 次 于 CPU 和 存储 器 。 


7.4 MO 体系 结构 


我 们 将 输入 /输出 (0O) 定 义 为 一 个 子 系统 部 件 ， 它 在 由 CPU 和 主 存储 器 组 成 的 主机 系统 
与 外 围 设备 之 间 移 动 编码 数据 。 输 入 /输出 子 系统 包括 但 不 限于 以 下 部 分 : 

。 用 于 IO 功能 的 主 存储 器 模块 

。 提供 将 数据 从 系统 中 移入 或 移出 所 需要 的 总 线 通 道 

。 主机 和 外 围 设备 中 的 控制 模块 

。 连接 外 部 组 件 的 接口 ， 如 键盘 和 磁盘 

。 连接 主机 系统 及 其 外 围 设备 之 间 的 电缆 或 其 他 通信 链 路 

图 7-1 描述 了 所 有 这 些 部 件 是 如 何 组 合 在 一 起 以 构成 集成 LO 子 系统 的 。LO 模块 负责 主 
存储 器 和 某 个 特定 设备 接口 之 间 的 数据 传递 。 接 口 是 专 门 设 计 的 电路 ， 用 来 与 某 些 特殊 类 型 的 
设备 (如 键盘 、 磁 盘 或 打印 机 ) 进行 通信 。 接 口 用 来 处 理 通信 方面 的 某 些 细节 问题 ， 从 而 确保 
设备 已 准备 好 处 理 下 一 批 数据 ， 或 确认 主机 已 经 准备 好 接收 来 自 外 围 设备 的 下 一 批 数据 。 






设备 适配器 电路 板 
( 适配器 卡 ) 


图 7-1 LO 配置 模型 


发 送 设备 和 接受 设备 之 间 交 换 信号 的 具体 形式 和 信号 所 代表 意义 被 称 为 协议 。 协 议 包 括 : 
命令 信号 ， 如 “打印 机 复位 ”; 状态 信号 ， 如 “磁带 就 绪 ”; 数据 传递 的 信号 ， 如 “这 里 是 您 
要 求 的 字 节 ”。 在 大 多 数 数据 交换 协议 中 ， 接 收 设备 必须 确认 发 送 给 它 的 命令 和 数据 ,或 表明 
它 已 经 准备 好 接收 数据 。 这 种 类 型 的 协议 交换 称 为 握手 。 

用 来 处 理 大 量 数据 块 的 外 围 设备 (如 打印 机 、 磁 盘 和 磁带 驱动 器 ) 通 常 配 备 有 缓冲 存储 器 。 
缓冲 器 允许 主机 系统 以 最 快 的 方式 将 大 量 数据 发 送 到 外 围 设 备 ， 而 无 须 等 待 缓慢 的 机 械 设 备 实 
际 写 入 数据。 磁盘 驱动 器 上 的 专用 内 存 通常 属于 高 速 缓存 ， 而 通常 提供 较 慢 的 RAM 给 打印 机 。 

设备 控制 电路 将 数据 从 板 载 缓 冲 区 取出 或 放 和 人 人， 并 确保 它 到 达 目 的 地 。 在 写 人 磁盘 的 情况 
下 ， 这 涉及 确保 磁盘 被 正确 地 放置 以 便 将 数据 写 人 特定 位 置 。 对 于 打印 机 而 言 ， 这 些 电路 将 打 
印 头 或 激光 束 移动 到 下 一 个 字符 位 置 ， 启 动 打印 头 、 弹 出 打印 纸 等 。 
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磁盘 和 磁带 属于 持久 性 存储 的 形式 ， 之 所 以 这 样 说 ， 是 因为 数据 在 它们 上 面 存储 的 时 间 比 
在 易 失 性 的 主 存储 器 要 长 。 然 而 ,没有 哪 种 存储 方法 是 永久 的 。 在 磁性 介质 上 存储 数据 的 预期 
寿命 为 5 ~30 年 ， 而 光学 介质 的 预期 寿命 则 长 达 100 年 。 


7.4.1 MO 控制 方法 


由 于 在 各 种 各 样 的 IO 设备 之 间 控 制 方式 和 传输 模式 存在 巨大 差异 ， 尝 试 直接 把 它们 连接 
到 系统 总 线 上 是 不 可 行 的 。 取 而 代 之 的 是 ， 用 专用 的 VO 模块 作为 CPU 和 外 围 设备 之 间 的 接 
口 。 这 些 模块 能 够 执行 许多 功能 ， 包 括 控制 设备 的 操作 、 数 据 缓冲 、 执 行 错误 检测 ， 并 与 CPU 
进行 通信 。 在 本 节 中 ， 我 们 着 重 关 注 的 是 那些 与 CPU 连接 的 VO 模块 的 通信 方法 ， 从 而 控制 
AYO。 计算 机 系统 通常 采用 五 种 ZKO 控制 方法 中 的 任何 一 种 ， 包 括 程 序 控制 /VO、 中 断 驱动 
MO 、 存 储 器 映射 /O 、 直 接 存 储 器 存 取 和 通道 控制 /O。 某 种 方法 并 不 一 定 比 其 他 方法 好 ， 这 
些 方 法 都 是 为 了 让 计算 机 能 够 更 好 地 控制 LO 从 而 影响 整个 系统 的 设计 与 性 能 。 客 观 来 讲 ， 当 
一 种 IO 方式 应 用 于 一 个 特定 的 计算 机 体系 结构 时 ， 我 们 需要 看 该 系统 怎样 使 用 它 ， 才 能 判断 
其 是 否 适用 。 

”程序 控制 VO 

CPU 与 0 设备 进行 通信 的 最 简单 的 方式 就 是 通过 程序 控制 VO ， 有 时 称 为 轮 询 MO( 或 端 
口 VO) 。CPU 不 断 地 监视 ( 轮 询 ) 与 每 个 IO 端口 相关 联 的 控制 寄存 器 。 当 一 个 字 节 到 达 端 口 
时 ， 控 制 寄存 器 中 的 一 位 也 被 置 位 。CPU 最 终 轮 询 端口 ， 并 注意 到 “数据 就 绪 ” 控 制 位 被 置 
为 1。CPU 置 位 控制 位 ， 检 索 字 节 ， 并 根据 为 该 特定 端口 编写 的 指令 进行 处 理 。 处 理 完 成 后 ， 
CPU 将 像 以 前 一 样 继续 轮 询 控制 寄存 器 。 

这 种 方法 的 好 处 是 可 以 通过 编程 来 控制 每 个 设备 的 行为 。 通 过 修改 几 行 代码 ， 我 们 可 以 调 
整 系统 中 的 设备 数量 和 类 型 ， 以 及 轮 询 的 优先 级 和 时 间 间 隔 。 但 是 频繁 地 轮 询 寄 存 器 会 带 来 一 
个 比较 麻烦 的 问题 。CPU 在 一 个 连续 的 “ 忙 等 待 ” 中 循环 ， 直 到 它 开 始 服务 某 个 IO 请 求 。 
如 果 没 有 LO 任务 要 处 理 ， 那 么 CPU 也 无 法 从 事 任何 有 用 的 工作 。 另 一 个 问题 是 决定 轮 询 的 
频率 ， 一些 设 备 可 能 需要 比 别 的 设备 更 频繁 地 进行 轮 询 。 由 于 这 些 限制 ， 程 序 控制 IO 最 适合 
用 在 某 些 专用 系统 上 ， 如 自动 取款 机 和 控制 或 监测 环境 事件 的 符 入 式 系统 。 

中 断 驱动 MO 

中 断 驱动 /O 是 一 种 更 通用 和 有 效 的 控制 方法 ， 可 以 将 其 看 作 和 程序 控制 LO 相反 ， 不 是 
CPU 不 断 询问 与 它 连 接 的 设备 是 否 有 输入 ， 而 是 设备 告诉 CPU 何 时 有 要 发 送 的 数据 。CPU 继续 执 
行 其 他 任务 ， 直 到 请 求 服务 的 设备 向 CPU 发 送 一 个 中 断 为 止 。 这 些 中 断 通常 是 由 传输 的 信息 字 产 
生 的 。 在 大 多 数 中 断 驱动 VO 的 实现 中 ， 这 种 通信 通过 一 个 中 间 中 断 控制 器 进行 通信 。 该 电路 处 
理 系统 中 所 有 LO 设备 的 中 断 信号 。 一 旦 该 电路 从 连接 的 任何 设备 中 识别 出 中 断 请 求 信号 ， 它 就 
会 产生 一 个 中 断 信 号 ， 该 信号 激活 系统 总 线 上 的 控制 线 。 控 制 线 通 常 直 接连 接 到 CPU 芯片 的 一 个 
引 脚 上 。 配 置 示 例如 图 7-2 所 示 。 系 统 中 的 每 一 个 外 围 设备 都 可 以 访问 中 断 请 求 线 。 中 断 控 制 芯 
片 对 于 每 条 中 断 控制 线 都 有 输入 。 每 当 一 个 中 断 线 被 置 位 时 ， 控 制 器 解码 中 断 并 向 CPU 输入 该 中 
断 (INT)。 当 CPU 准备 好 处 理 中 断 时 ， 它 会 置 位 中 断 应 答 (INTA ) 信号。 一 旦 中 断 控 制 器 得 到 该 
应 答 ， 它 可 以 降低 其 INT 信号 。 当 两 个 或 多 个 IO 中 断 同时 发 生 时 ， 中 断 控制 器 将 根据 请 求 I/ 
0 设备 的 时 间 关 键 性 决定 哪 一 个 应 该 优先 。 键 盘 和 鼠标 的 优先 级 是 最 低 的 。 

当 多 个 设备 同时 引发 中 断 时 ， 系 统 设 计 人 员 将 确定 哪些 设备 应 优先 于 其 他 设备 ， 然 后 将 中 
断 优先 级 固化 到 IO 控制 器 中 ， 使 其 几乎 不 可 能 改变 。 使 用 同一 个 操作 系统 和 中 断 控制 器 的 计 
算 机 将 低 优 先 级 设备 (如 键盘 ) 连接 到 同一 个 中 断 请 求 线 上 。 中 断 请 求 线 的 数量 是 有 限 的 ， 在 
某 些 情 况 下 ， 中 断 可 以 共享 ， 共 享 的 中 断 不 会 导致 任何 问题 ， 因 为 我 们 知道 没有 两 个 设备 会 在 
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同一 时 间 请 求 相同 的 中 断 。 例 如 ， 一 台 扫 描 仪 和 一 台 打印 机 可 以 使 用 相同 的 中 断 并 能 和 平 共 
处 。 串 行 鼠 标 和 调制 解 调 器 并 不 总 是 这 样 ， 它 们 往往 是 尝试 共享 相同 的 中 断 ， 导 致 双方 在 这 种 
情况 下 会 产生 奇怪 的 行为 。 

在 第 4 章 中 ,我 们 描述 了 中 断 处 理 是 如 何 改变 取 指 - 译 码 - 执行 周期 的 。 我 们 在 图 7-3 中 
重 现 了 图 4-12 在 每 次 取 指 - 译 码 - 执行 周期 开始 时 ， 如 何 完成 当前 指令 的 执行 并 检查 中 断 引 
脚 (不 仅仅 是 WO) 的 状态 。 一 旦 处 理 器 应 答 了 中 断 ， 它 将 保存 当前 状态 并 处 理 中 断 (如 图 7-4 
所 示 ， 也 取 自 第 4 童 )。 





图 7-2 ”一 个 使 用 中 断 的 YO 子 系统 


中 断 驱 动 VO 是 一 种 类 似 于 程序 控制 的 /0， 它 
可 以 修改 服务 程序 以 便 适 应 硬件 的 变化 。 若 计算 机 运 
行 在 相同 类 型 和 级 别 的 操作 系统 上 ， 则 属于 不 同 硬件 
类 型 的 地 址 向 量 通常 会 保存 在 系统 的 相同 位 置 中 。 因 
此 ,我 们 很 容易 改变 这 些 地 址 向 量 ， 以 使 其 指向 专用 
设备 的 代码 。 例 如 ， 如 果 有 人 需要 使 用 一 种 新 的 磁盘 
驱动 器 ， 但 目前 流行 的 操作 系统 并 不 支持 这 个 磁盘 驱 
动 器 。 那 么 ， 该 磁盘 的 制造 商 可 以 提供 专门 的 设备 驱 
动 程序 ， 以 便 与 标准 设备 的 代码 一 起 保存 在 内 存 中 。 
设备 驱动 代码 的 安装 涉及 更 新 磁盘 WO 向 量 以 指向 应 
用 于 特定 磁盘 驱动 器 的 代码 。 

我 们 在 第 4 章 中 提 到 IO 中 断 是 可 屏蔽 的 ， 如 果 
LO 设备 遇 到 不 能 处 理 的 错误 ， 则 产生 不 可 屏蔽 中 
断 ， 如 一 个 VO 介质 的 移 除 或 销毁 破坏 。 我 们 将 在 第 
10 章 中 回 到 这 个 主题 。 

存储 器 映射 /O 

系统 VO 控制 方法 的 设计 决策 在 确定 系统 的 整体 
架构 中 是 非常 有 影响 力 的 。 如 果 决 定 使 用 程序 控制 
LO ,我 们 可 以 为 内 存 流量 和 LO 流量 建立 独立 的 总 
线 ， 以 便 继续 轮 询 不 会 干扰 内 存 访问 。 在 这 种 情况 
下 ， 该 系统 对 于 IO 控制 需要 一 组 不 同 的 指令 。 具 体 
而 言 ， 就 是 系统 需要 知道 如 何 检查 设备 的 状态 ， 从 设 
备 中 输入 和 输出 字 节 ， 并 能 验证 传输 已 正确 执行 。 这 
种 方法 有 一 些 严 重 的 局 限 性 。 例 如 ， 若 向 系统 添加 新 
的 设备 类 型 则 可 能 需要 改变 处 理 器 的 控制 存储 或 硬 连 
线 控制 矩阵 。 


图 7-3 具有 中 断 检 查 的 取 指 - 译 码 -中断 周期 





图 7-4 处 理 中 断 
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一 个 更 简单 、 更 优雅 的 方法 是 存储 器 上 映射/O， 其 中 LO 设备 和 主 存储 器 共享 相同 的 地 址 
空间 。 因 此 ， 每 一 个 IO 设备 都 有 自己 保留 的 存储 块 。L0 设备 间 的 数据 传输 涉及 向 主 存 地 址 
中 移动 ， 这 个 地 址 是 映射 到 设备 上 的 。 因 此 存储 器 映射 VO 看 起 来 就 像 从 CPU 角度 来 看 存储 
器 访问 。 这 意味 着 我 们 可 以 使 用 相同 的 指令 将 数据 移 人 移出 WO 和 内 存 ， 这 大 大 简化 了 系统 
设计 。 

在 小 型 系统 中 ， 数 据 传输 的 低级 细节 被 下 放 到 由 LO 设备 本 身 构建 的 VO 控制 器 中 ， 如 
图 7-1 所 示 。CPU 不 需要 关注 以 下 内 容 : 该 设备 是 否 准备 就 绪 ， 计 算 传 输 中 的 字 节 数 ， 计 算 纠 
错 码 。 

直接 存储 器 存 取 

不 管 是 采用 程序 控制 YO 还 是 中 断 驱 动 IO，CPU 都 要 从 IO 设备 移 人 或 移出 数据 。 在 IO 
过 程 中 ，CPU 会 运行 一 些 如 下 所 示 的 伪 代 码 指令 : 

WHILE More-input AND NOT (Error or Timeout) 

ADD 1 TO Byte-count 

IF Byte-count > Total-bytes-to-be-transferred THEN 
EXIT 

ENDIF 

Place byte in destination buffer 


Raise byte-ready signal 
Initialize timer 


REPEAT 
WAIT 
UNTIL Byte-acknowledged, Timeout, OR Error 
ENDWHILE 


显然 ， 这 些 指 令 非常 简单 ， 完 全 可 以 使 用 专用 芯片 来 编程 。 这 就 是 直接 存储 器 存 取 
(DMA) 背 后 的 思想 。 当 一 个 系统 使 用 DMA 时 ，CPU 就 不 需要 再 执行 兄长 的 IO 指令 。 为 了 有 
效 地 传送 数据 ，CPU 必须 为 DMA 控制 器 提供 要 传输 数据 的 字 节 地 址 、 字 节 数 ， 以 及 目标 设备 
或 存储 器 地 址 。 这 种 通信 联系 通常 要 利用 CPU 上 的 专用 IO 寄存 器 来 完成 。 典 型 的 DMA 结构 
示意 如 图 7-5 所 示 。 在 这 个 示意 图 中 ，LO 和 内 存 共 享 相同 的 地 址 空间 ， 所 以 它 是 一 种 内 存 映 
射 型 IO。 

一 旦 在 存储 器 中 装 入 了 所 需 数值 ， 
CPU 将 向 DMA 子 系统 发 出 信号 并 继续 
执行 下 一 个 任务 ， 而 DMA 负责 处 理 WO 
的 细节 。 在 LO 完成 (或 错误 结束 ) 之 
后 ，DMA 子 系统 通过 发 送 另 一 个 中 断 来 
通知 CPU 。 

在 图 7-5 中 可 以 看 到 ，DMA 控制 器 
和 CPU 共享 总 线 。 同 一 时 间 只 有 一 个 设 
备 可 以 控制 总 线 ， 即 这 个 设备 是 总 线 主 
控 设 备 。 一 般 来 说 ，LO 操作 要 优先 于 
CPU 从 内 存 中 读 取 程序 指令 和 数据 ， 因 
为 许多 LO 设备 按照 严格 的 时 序 参 数 执 图 7-5 DMA 配置 示例 
行 操作 。 如 果 在 指定 的 时 间 内 检测 不 到 任何 活动 ， 它 们 会 超时 并 中 断 LO 进程 。 为 了 避免 设备 
超时 ，DMA 会 利用 由 CPU 使 用 的 存储 器 周期 来 完成 IO 操作 ， 这 称 为 周期 窃取 。 幸 运 的 是 ， 
LO 往往 在 总 线 上 创建 突 发 式 传输 : 即 成 块 或 成 组 地 发 送 数据 。 在 这 种 突 发 式 传输 的 间 际 ， 将 
会 授权 CPU 访问 总 线 。 由 于 这 种 总 线 的 访问 过 程 不 会 持续 很 长 时 间 ， 因 此 人 们 不 会 抱怨 系统 
是 在 “I/O 过 程 中 扑 行 ”。 
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图 7-6 显示 了 CPU 和 DMA 交互 的 泳 道 图 ， 强 调 了 DMA 如 何在 CPU 中 代替 VO 处 理 。 





CPU DMA 


请 求 1/ 0 传输 四 
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图 7-6 显示 CPU 和 DMA 交互 的 泳 道 图 


通道 控制 |/O 

程序 控制 VO 一 次 传输 一 个 字 节 。 中 断 驱动 VO 根据 参与 0 过 程 的 设备 类 型 一 次 传输 一 
个 字 节 或 一 小 块 处 理 数据 。 通 常 ， 速 度 较 慢 的 设备 (例如 键盘 ) 传输 相同 字 节 数 要 比 磁盘 驱动 
器 和 打印 机 产生 更 多 的 中 断 过 程 。DMA 方法 是 面向 数据 块 的 WO 处 理 方 式 ， 它 仅 在 一 组 字 节 
传输 完成 (或 失败 ) 后 才 会 中 断 CPU。 在 DMA 发 出 WO 完成 的 信号 后 ，CPU 会 给 出 下 一 个 要 读 
取 或 写 人 的 内 存 地 址 。 而 在 传输 失败 的 事件 中 ，CPU 会 负责 采取 适当 的 措施 。 因 此 ，DMA LO 
比 起 中 断 驱 动 VO 只 需要 很 少 的 CPU 参与 。 这 种 开销 对 于 小 型 单 用 户 系统 来 说 是 很 好 的 ; 然 
而 ， 它 不 能 很 好 地 扩展 到 诸如 大 型 计算 机 的 大 型 多 用 户 系统 上 。 大 多 数 大 型 计算 机 系统 使 用 名 
为 /O 通道 的 智能 型 DMA 接口 。 通 道 控制 IO 在 传统 的 大 型 机 上 使 用 ， 但 它 在 文件 服务 器 和 
存储 网 络 上 的 使 用 也 变 得 越 来 越 普 遍 。 存 储 网 络 和 其 他 高 性 能 的 LO 实现 在 第 13 章 中 进行 
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讨论 。 

利用 通道 控制 /O， 一 个 或 多 个 VO 处 理 器 可 以 控制 多 条 不 同 的 IO 路 径 ， 这 些 路 径 称 
为 通道 路 径 。 对 于 “ 慢 速 ”设备 (如 终端 设备 和 打印 机 ) 来 说 ,通道 路径 可 以 组 合 在 一 起 
( 复 用 ) ， 人 允许 仅 通过 一 个 控制 器 来 管理 几 个 这 类 设备 。 在 IBM 大 型 计算 机 中 ， 一 个 多 路 复 
用 的 通道 路 径 被 称 为 多 路 复 用 器 通道 。 而 服务 于 磁盘 控制 咒 和 其 他 “人 快速 ”设备 的 通道 称 
为 选择 器 通道 。 

LO 通道 由 一 些 名 为 VO 处 理 器 (IOP) 的 小 CPU 来 控制 ， 这 些 CPU 是 专门 为 WO 优化 设计 
的 。 不 像 DMA 的 控制 电路 ，IOP 具有 执行 包括 算术 逻辑 指令 和 分 支 转移 指令 的 能 力 。 图 7-7 描 
述 了 一 个 简化 的 通道 控制 V0 的 配置 。 








图 7-7 通道 控制 VO 的 配置 


IOP 执行 由 主机 处 理 器 放置 在 主 系统 存储 器 中 的 程序 。 这 些 程序 由 一 系列 通道 命令 字 
(CCW) 组 成 ， 不 但 包括 实际 的 传输 指令 ， 还 包括 控制 YO 设备 的 命令 。 这 些 控制 命令 包含 不 
同类 型 设备 的 初始 化 、 打 印 机 纸张 输出 和 磁带 倒 回 等 命令 。 一 旦 将 I/O 程序 放置 到 内 存 中 ， 主 
机 处 理 器 将 发 出 一 个 启动 子 通道 (SSCH ) 的 命令 , 通知 IOP 在 哪里 可 以 找到 程序 的 内 存 地 址 。 
在 IOP 完成 任务 后 ， 它 会 在 内 存 中 放置 任务 已 经 完成 的 信息 ， 并 且 向 CPU 发 送 一 个 中 断 信号。 
然后 ，CPU 得 到 该 完成 信息 ， 并 针对 相应 的 返回 代码 做 出 动作 。 

独立 DMA 与 通道 控制 IO 的 主要 区 别 在 于 IOP 的 智能 特性 。IOP 能 够 对 协议 进行 协商 ， 发 出 
各 种 设备 命令 ， 将 存储 代码 转换 为 内 存 代 码 ， 并 可 以 独立 于 主机 CPU 来 传输 多 个 完整 的 文件 或 文 
件 组 。 而 主机 只 负责 为 VO 操作 创建 程序 指令 ， 以 及 通知 IOP 在 哪里 能 找到 这 些 程序 指令 。 

像 独立 DMA 一 样 ，IOP 必须 能 够 从 CPU 中 窃取 存储 器 周期 。 但 与 独立 DMA 所 不 同 的 是 ， 
通道 控制 YO 系统 都 配备 单独 的 IO 总 线 ， 它 们 用 来 帮助 实现 隔离 主机 和 1/O 的 操作 ， 因 此 通 
道 控制 WO 是 隔离 式 VO 的 一 种 。 例 如 ， 如 果 从 磁盘 中 拷贝 一 个 文件 到 磁带 ， 那 么 IOP 仅 会 在 
从 主 存储 器 中 提取 指令 时 ， 才 使 用 系统 存储 器 总 线 。 余 下 的 数据 传输 只 需 使 用 IO 总 线 来 完 
成 。 由 于 具有 智能 性 和 总 线 隔离 性 的 优点 ， 因 此 通道 控制 IO 通常 在 高 吞吐 量 的 事务 处 理 环 境 
中 使 用 。 在 这 种 情况 下 使 用 通道 控制 VO 的 代价 和 复杂 性 是 合理 的 。 


7.4.2 字符 MO 与 块 VO 


按 下 计算 机 键盘 上 的 一 个 键 可 以 启动 一 系列 把 击 键 作 为 单个 事件 处 理 的 活动 (无 论 键 人 多 
快 ) 。 原 因 在 于 键盘 的 机 制 。 每 个 键 控制 一 个 小 开关 ， 这 个 开关 闭合 了 位 于 键 下 方 水 平和 垂直 
布置 的 导体 矩阵 中 的 一 个 连接 。 当 键 开 关闭 合 时 ， 键 盘 电 路 读 取 不 同 的 扫描 码 。 然 后 将 扫描 码 
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传送 到 串 行 接口 电路 ， 这 个 电路 可 将 扫描 码 转换 为 字符 码 。 该 接口 电路 将 字符 码 放置 在 键盘 组 
冲 区 中 ， 并 在 低地 址 内 存 中 维护 。 紧 接着 ,一 个 VO 中 断 信号 被 置 位 为 高 电 平 。 这 些 字符 在 组 
冲 区 中 耐心 等 待 ， 直到 它们 被 程序 (或 是 缓冲 区 重 置 位 ) 检 索 到 为 止 。 键盘 电路 只 能 在 旧 的 键 
盘 路 径 到 达 缓 冲 区 之 后 才能 处 理 新 的 按键 。 虽 然 可 以 一 次 按 两 个 键 ， 但 一 次 只 能 处 理 一 个 。 由 
于 字符 0O 具有 随机 连续 的 性 质 ， 因 此 通过 中 断 驱 动 /0 对 它 进行 处 理 是 最 好 的 。 

磁盘 和 磁带 在 数据 块 中 存储 数据 。 因 此 ， 它 使 得 以 块 为 单位 管理 磁盘 和 磁带 LO 变 得 有 意 
义 。 块 VO 将 其 本 身 借 给 DMA 或 者 通道 控制 VO 来 处 理 。 块 可 以 有 不 同 的 大 小 ， 这 取决 于 特 
定 的 人 硬件、 软件 和 程序 。 在 调整 系统 以 达到 最 佳 性 能 的 过 程 中 ,确定 理想 的 块 大 小 是 一 项 重要 
活动 。 高 性 能 系统 处 理 大 的 块 比 处 理 小 的 块 更 有 效 。 较 慢 的 系统 应 该 在 较 小 的 块 上 管理 字 节 ; 
否则 ， 系 统 可 能 会 在 10 输入 时 没有 响应 。 


7. 4.3 MO 总 线 操作 


在 第 1 章 中 ,我 们 介绍 了 图 7-8 所 示 的 计算 机 总 线 体系 结构 。 这 幅 图 所 传达 的 重要 思想 是 : 
系统 总 线 是 计算 机 系统 中 许多 组 件 间 


人 了 
共享 的 资源 。 (ALU 寄存 


必须 控制 对 这 个 共享 资源 的 访问 ， 这 制 器 ) 
就 是 为 什么 需要 有 控制 总 线 的 原因 。 

从 我 们 以 前 的 讨论 中 可 以 明显 看 出 ， 存 储 
器 总 线 和 1/O 总 线 可 以 是 相互 独立 的 实体 。 事 
实 上 ， 把 它们 分 开 是 一 个 好 主意 。 让 内 存 有 自 
己 的 总 线 的 一 个 很 好 的 理由 是 ， 这 样 可 以 使 内 
存 的 数据 传输 是 同步 的 ， 这 时 系统 可 以 使 用 多 
个 CPU 的 时 钟 周 期 从 主 存储 器 中 检索 数据 。 国人 系 比 和 二 的 商 局 钢 因 
在 一 个 功能 完善 的 系统 中 ， 永 远 都 不 会 出 现 内 存 脱 机 ， 或 者 由 于 某 些 相同 类 型 的 错误 ( 比如 打 
印 机 纸张 用 完 ) 而 困扰 外 围 设备 的 问题 。 

从 另 一 方面 来 说 ，LO 总 线 并 不 能 同步 操作 。 它 们 必须 要 考虑 这 样 一 个 事实 ，1/O 设备 不 
能 总 在 准备 处 理 1/0 传输 。 置 于 1/0 总 线 上 和 1/0 设备 之 间 的 1/0 控制 电路 彼此 协商 以 决定 每 
个 设备 可 能 使 用 总 线 的 时 间 。 因 为 在 每 次 总 线 访问 时 都 会 发 生 这 些 握手 事件 ， 所 以 0 总 线 也 
称 为 异步 总 线 。 通 常 ， 区 分 同步 传输 和 异步 传输 的 方法 是 : 同步 传输 要 求 传输 的 发 送 者 和 接收 
者 共享 同一 个 公共 的 时 序 。 但 是 ， 异 步 总 线 协议 也 同样 要 求 有 一 个 位 时 序 时 钟 来 描绘 信号 的 转 
变 。 在 我 们 学 习 了 一 个 例子 之 后 ， 这 种 观点 将 会 变 得 非常 清楚 。 

再 次 考虑 图 7-5 中 所 示 的 配置 。DMA 电路 和 设备 接口 电路 之 间 的 连接 在 图 7-9 中 表示 得 更 
加 准确 ， 图 中 显示 了 单独 的 组 件 总 线 。 








图 7-9 显示 地 址 总 线 、 数 据 总 线 和 控制 总 线 的 DMA 配置 
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图 7-10 给 出 了 磁盘 接口 电路 连接 3 种 总 线 的 细节 。 地 址 总 线 和 数据 总 线 分 别 由 一 组 单独 
的 导线 构成 ， 每 一 根 线 都 有 1 个 信息 位 。 数 据 线 的 数量 决定 了 总 线 的 宽度 。 具 有 8 根 数据 线 的 
数据 总 线 可 以 同时 传输 一 个 字 节 。 地 址 总 线 需 要 有 足够 多 的 导线 来 唯一 地 识别 总 线 上 的 每 一 个 


设备 D 
证 乡 
磁盘 ”| 地 址 Se 磁盘 
控制 器 | 译 码 器 | IO 控制 器 | 译 码 器 


数据 





















图 7-10 ”连接 到 WO 总 线 的 磁盘 控制 器 接口 


图 7-10 所 示 的 一 组 控制 线 只 画 出 了 为 举例 说 明 所 需 的 最 少数 目的 控制 线 。 实 际 的 IO 总 
线 通常 多 于 12 根 控 制 线 。( 原 IBM 个 人 计算 机 的 控制 线 已 经 超过 20 条 ! ) 控制 总 线 负责 协调 总 
线 及 其 附属 设备 的 活动 。 为 了 将 数据 写 人 磁盘 驱动 器 中 ， 例 子 中 的 总 线 会 执行 如 下 的 操作 
顺序 : 

1. DMA 电路 将 磁盘 控制 器 的 地 址 放置 在 地 址 线 上 ， 并 激活 (断言 ) Reduest 和 Write 
信和 号 。 
2. 当 Request 信和 号 确认 有 效 后 ， 控 制 器 中 的 译 码 电路 会 查询 地 址 线 。 

3. 按照 所 查询 的 地 址 ， 译 码 器 启动 磁盘 控制 电路 。 如 果 磁 盘 写 人 数据 有 效 ， 则 控制 器 就 
会 在 Ready 线 上 施加 一 个 信号 。 这 时 ， 就 完成 了 DMA 和 控制 器 的 握手 。 当 Ready 信号 变 为 
高 电 平 后 ， 其 他 设备 就 不 可 以 使 用 总 线 了 。 

4. DMA 电路 把 数据 放 到 数据 线 上 ， 并 使 Request 信和 号 变 为 低 电 平 。 

5.， 当 磁盘 控制 器 看 到 Request 信号 变 为 低 电 平 后 ， 磁 盘 控 制 器 将 字 节 从 数据 线 上 传输 到 
磁盘 缓冲 区 中 ， 然 后 撤销 磁盘 控制 器 的 Ready 信号 。 

为 了 使 这 一 处 理 过 程 变 得 更 加 清晰 和 准确 ， 工 程 师 常常 会 使 用 时 序 图 来 描述 总 线 操 作 。 磁 
盘 写 操作 的 时 序 图 如 图 7-11 所 示 。 图 中 标注 为 W ~ 加 的 垂直 线 表示 不 同 信号 的 持续 时 间 。 在 实 
际 的 时 序 图 中 ， 一段 精确 的 持续 时 间 将 被 划分 为 相等 的 时 间 间 隔 ， 通 常 间隔 为 50ns。 总 线 上 的 
信号 只 在 时 钟 周 期 发 生 转 换 时 才 会 改变 。 注 意 ， 图 中 所 描述 的 各 种 信和 号 并 不 会 立即 上 升 和 下 
降 。 这 一 点 正 反 映 了 总 线 的 物理 本 质 。 必 须要 有 少量 的 时 间 来 容许 信号 电 平稳 定 下 来 。 这 个 稳 
定时 间 很 小 ， 但 是 在 长 时 间 的 VO 转换 过 程 中 这 也 会 引起 较 大 的 延迟 。 

在 时 序 图 中 地 址 和 数据 线 很 少 单独 显示 ， 通 常 成 组 出 现 。 在 图 7-11 中 ， 我 们 用 一 对 线 
表示 这 个 线 组 。 当 地 址 和 数据 线 从 活跃 状态 过 渡 到 非 活 跃 状态 时 ， 我们 将 会 使 这 对 线 交 叉 。 
当 这 些 线 处 于 非 活跃 状态 时 ,我 们 在 它们 之 间 标 注 阴 影 ， 以 明确 表示 它们 的 状态 是 不 确 
定 的 。 

许多 实际 的 VO 总 线 与 例 中 所 示 的 IO 总 线 并 不 完全 相同 ， 它 们 常常 没有 单独 的 地 址 和 数 
据 线 。 由 于 IO 总 线 具 有 异步 特征 ， 因 此 数据 线 也 能 用 来 保存 设备 的 地 址 。 因 此 ， 需 要 添加 另 
外 一 条 控制 线 ， 来 指示 数据 线 上 传输 的 信号 是 代表 地 址 还 是 数据 。 这 种 方法 与 存储 器 总 线形 成 
了 鲜明 的 对 比 。 对 于 存储 器 总 线 的 情形 ， 地 址 信号 和 数据 信号 必须 同时 有 效 。 


























时间 | ,是 示 总线 仿 生 ES 和 oo 
| | 置 位 写 信号 | 写 请 求 总 线 (不 是 读 ) | 
| %。 | 置 位 地 址 信号 | 给 出 写 入 字 节 的 位 置 
| 二 | 置 位 请 求 信号 | 请 求 地 址 线 写 和 地址 
| 4 | 置 位 准备 信号 。 | 应 答 写 请 求 信号 ， 字 节 放 到 数据 线 上 | 









;~ | 数据 线 写 数据 ( 需要 多 个 周期 ) 
| | 复位 准备 信号 。 | 释放 总 线 





图 7-11 总 线 的 时 序 图 


7.5 数据 传输 模式 


可 以 通过 一 次 发 送 一 位 或 一 次 一 个 字 节 在 主机 和 外 围 设备 之 间 传 输 数据 ， 分 别称 为 串 行 和 
并 行 传输 模式 。 每 种 传输 模式 都 要 在 主机 和 设备 接口 之 间 建 立 特定 的 通信 协议 。 





字 节 、 数 据 和 信息 的 记录 





很 多 人 使 用 信息 (information ) 这 个 词 作为 数据 的 同义词 ， 并 且 把 数据 (data) 作为 字 节 
(byte) 的 同义词 。 事 实 上 ， 为 了 文本 的 可 读 性 ， 希 望 语 境 意义 明确 ， 我 们 经 常 使 用 数据 作为 一 
个 字 节 的 同义词 。 必 须 指 出 的 是 ， 这 些 词 在 意义 上 的 确 是 有 很 大 区 别 的 。 

从 字面 意义 上 看 ， 数 据 这 个 词 是 复数 。 它 来 源 于 拉丁 词 的 单数 形式 datum。 后 来 ， 由 于 要 
涉及 一 个 以 上 的 datum， 所 以 人 们 就 使 用 了 data 这 个 词 。 事 实 上 我 们 经 常 听 到 有 人 说 : “最 近 
的 死亡 率 数 据 表明 ， 人 们 现在 比 一 个 世纪 以 前 活 的 时 间 更 长 ”(The recent mortality data indicate 
that people are now living longer than they did a century ago) 。 听 到 这 样 的 话语 时 ， 我 们 会 觉得 很 

然 ， 但 却 无 法 解释 为 什么 不 说 “数据 从 内 存 交 换 到 磁盘 时 ， 有 一 页 出 错 ”(A page fault oc- 
curs when data are swapped from memory to disk) 。 谈 论 存 储 在 计算 机 系统 中 的 东西 时 ， 我 们 实际 
上 已 经 把 数据 概念 化 成 一 个 “不 可 区 分 的 主体 "， 就 像 我 们 对 空气 和 水 的 感觉 一 样 。 空 气 和 水 
由 称 为 分 子 的 各 种 分 立 元 素 组 成 。 相 应 地 ， 由 大 后 分 立 素 组 成 的 大 量 数 据 称 为 数据 。 很 明显 ， 
没有 一 个 受过 教育 的 说 英语 很 流利 的 人 会 说 “She breathes airs”， 或 者 说 “She takes a bath in 
waters”。 因 此 ,这样 看 起 来 下 面 的 说 法 也 是 非常 合理 的 ，“ 数 据 从 存储 器 中 交换 到 磁盘 上 ” 
(… data is swapped from memory to disk) 。 大 多 数 的 学 术 资 源 ( 包 括 《 美 国 传统 词典 》) 现在 都 认 
同 把 数据 作为 一 个 单数 的 集合 名 词 来 使 用 。 
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严格 来 说 ， 计 算 机 的 存储 介质 存储 数据 。 计 算 机 存储 的 是 称 为 字 节 的 位 组 合 模式 。 例 
如 ， 如 果 使 用 二 进 制 扇 区 编辑 器 来 检查 磁 可 的 内 容 ， 那 么 就 可 能 看 到 010000100 模式 。 所 以 
从 结果 可 以 得 到 什么 启示 呢 ? 大 家 都 知道 ， 这 种 位 模式 可 能 是 程序 的 二 进 制 代码 、 操 作 系 
统 结构 的 部 分 内 容 、 一 张 照片 ， 或 是 某 人 银行 账户 的 余额 。 如 果 你 知道 这 些 位 代表 的 是 一 
些 数字 量 (而 不 是 程序 代码 或 图 像 文件 )， 并 且 还 知道 它 是 采用 二 进 制 补 码 形式 来 存储 的 ， 
那么 你 就 可 以 非常 肯定 地 说 ， 它 代表 的 是 十 进 制 数 68。 但 是 ， 你 仍然 没有 得 到 datum。 在 得 
到 datum 之 前 ， 人 们 必须 要 把 某 些 上 下 文 与 这 个 数字 联系 起 来 。 例 如 ， 它 是 一 个 人 的 年 龄 或 
身高 ? 是 一 个 开 负 器 的 模型 编号 ? 如 果 你 知道 01000100 是 来 自 某 个 自动 气象 站 的 一 个 包含 
温度 输出 的 文件 ， 那 么 你 就 有 了 自己 的 datum。 磁 盘 上 的 文件 便 可 以 被 正确 地 称 为 数据 
交 御 ca 

现在 ， 你 可 能 猜测 气象 数据 使 用 华氏 度 来 表示 ， 因 为 地 球 上 没有 任何 地 方 的 温度 曾经 达到 
68%C 。 但 是 你 还 是 没有 得 到 信息 。 在 当前 情况 下 ， 这 个 数据 是 没有 意义 的 : 它 是 荷兰 的 阿 姆 斯 
特 丹 当前 的 温度 ? 还 是 三 年 前 的 凌晨 2:00 在 美国 的 迈阿密 记录 的 温度 ? 只 有 它 对 人 们 有 意义 
时 ， 数 据 68 才 变 成 信息 。 

最 近 普 遍 作为 单数 使 用 的 另 一 个 复数 拉丁 名 词 是 媒体 (media)。 以 前 ， 受 过 良好 教育 的 人 
只 是 在 提 及 一 个 以 上 的 媒介 (medium) 时 才 使 用 media 这 个 词 。 报 纸 是 一 种 类 型 的 通信 媒介 ， 而 
电视 是 另外 的 一 种 媒介 。 整 体 来 说 ， 它 们 都 是 媒体 。 但 是 现在 的 一 些 编辑 接受 这 样 的 单数 用 
法 :“ 此 时 ， 新 闻 媒 体 正 在 国会 大 厦 采 集 新 闻 ” (At this moment，the news media is gathering at 
the Capitol ) 。 

艺术 家 可 以 使 用 水 彩 媒 介 或 者 油画 媒介 来 画 画 ， 计 算 机 的 数据 记录 设备 可 以 将 信息 写 到 某 
个 电子 媒介 中 ， 例如 磁带 或 磁盘 。 整 体 来 说 ， 它 们 都 是 电子 媒体 。 但 是 我 们 却 很 少 看 到 一 个 计 
算 机 从 业者 会 有 意识 地 正确 使 用 这 个 术语 。 在 更 多 的 情况 下 ,我 们 过 到 的 是 类 似 于 下 面 的 陈 
述 :“Volume 2 ejected. Please place new media into the tape drive”。 在 这 里 ， 大 多 数 人 是 否 能 够 理 
解 下 面 这 个 指令 还 是 值得 商 梭 的 :“place a new medium into the tape drive”。 

当 计算 机 专家 力图 采用 数字 形式 来 表达 人 类 思想 时 ， 他 们 会 遇 到 这 样 的 语义 争论 (反之 刘 
然 ) 。 而 且 在 该 类 型 的 转换 过 程 中 肯定 会 丢失 信息 。 


7.5.1 并 行 数据 传输 


并 行 通信 系统 的 工作 方式 与 主机 的 存储 器 总 线 的 操作 非常 类 似 。 它 至 少 要 有 8 根 数据 线 
(每 一 位 对 应 于 一 根 数 据 线 )， 而且 还 需要 一 根 线 来 进行 同步 。 这 根 同 步 线 有 时 也 称 为 选 
通 线 。 

并 行 连接 对 于 短 距离 传输 非常 有 效 ， 这 个 距离 通常 短 于 30ft( 约 9m)。 具 体 长 度 主要 取决 
于 信和 号 的 强度 、 信 号 的 频率 和 电缆 的 质量 。 在 进行 长 距离 数据 传输 时 ， 电 缆 中 的 信和 号 会 因为 导 
体 的 内 部 电阻 而 不 断 减 弱 。 这 种 电信 号 随 着 距离 和 时 间 CA 过 
的 增加 而 损失 的 现象 称 为 衰减 。 通 过 学 习 一 个 例子 后 ， MI 


与 衰减 相关 的 问题 就 会 变 得 更 加 清楚 。 i 


图 7-12 给 出 了 一 个 并 行 打印 机 接口 电路 的 简化 时 序 。 Busy! 人 
1 


图 。 图 中 标注 为 nStrobe 和 nack 的 两 条 线 分 别 用 来 发 人 
送 选 通信 号 和 应 答 信 号 ， 低 电 平 有 效 。 当 施加 高 电 平 i ! | Wn 


时 ，Busy 和 Data 信号 有 效 。 换 言 之 ，Busy 和 Data i SC ，， ， > 条 
言 号 属于 正 逻辑 信号 ， 而 nsStrobe 和 nACk 信号 都 是 负 | 


逻辑 信号 ， 数 字 信 号 代表 8 根 不 同 的 线 。 这 些 线 中 的 每 ”图 7-12 并 行 打印 机 的 简化 时 序 图 


276 ”第 7 章 





一 根 都 可 以 为 高 或 低 (1 或 0)。 在 nstrobe 信号 有 效 之 前 和 nAck 信号 有 效 之 后 ， 这 些 线路 
上 的 信和 号 都 是 没有 意义 的 (如 图 7-12 中 阴影 所 示 )。 在 时 序 图 的 顶部 ， 列 出 了 从 i ~i 之 间 
的 任意 参考 时 间 。 两 个 连续 参考 时 间 之 差 At 决定 总 线 速 度 。 通 常情 况 下 ，At 的 范围 在 1 ~ 
5ms 之 间 。 

图 7-12 说 明了 在 打印 机 接口 电路 (位 于 主机 上 ) 和 一 台 并 行 打印 机 的 主机 接口 之 间 所 发 生 
的 握手 协议 。 当 在 8 根 数据 线 的 每 根 线 上 放置 1 位 数据 时 ， 这 个 握手 过 程 就 开始 了 。 接 下 来 ， 
就 是 检测 Busy 信号 线 是 否 处 于 低 电 平 。 一 旦 检测 到 Busy 信号 线 为 低 电 平 ， 则 选 通 信号 有 效 ， 
这 样 打印 机 就 知道 了 数据 线 上 有 数据 送 入 。 只 要 打印 机 检测 到 选 通信 号 ， 它 就 会 从 数据 线 上 读 
取 数 据 ， 同 时 将 Busy 信号 变 为 高 电 平 ， 以 防止 主机 向 数据 线 上 放置 更 多 的 数据 。 在 打印 机 已 
经 读 取 数据 线 上 的 数据 之 后 ，Busy 信号 变 成 低 电 平 ， 同 时 发 出 一 个 应 答 信号 nAck， 让 主机 知 
道 已 接收 到 数据 。 

值得 注意 的 是 ， 尽 管 已 经 确认 了 数据 信号 ， 但 是 这 并 不 能 保证 这 些 数据 的 正确 性 。 主 机 和 
打印 机 都 假设 接收 到 和 发 送 的 信号 是 完全 一 样 的 。 对 于 短 距 离 传输 ， 这 样 的 假设 是 相当 安全 
的 。 但 是 对 于 长 距离 传输 来 说 ， 情 况 并 非 如 此 。 

现在 假定 总 线 操作 的 电 平 为 +5V 或 -5V。 因 此 , 0~ +5V 之 间 的 任何 电压 都 被 认为 
是 “高 ” 电 平 , 而 0 ~ -5V 之 间 的 任何 电压 都 被 认为 是 “ 低 ” 电 平 。 主 机 在 不 同 的 数据 
线 上 放置 +5V 或 -5V， 它 们 分 别 对 应 于 数据 字 节 中 的 1 和 0。 随 后 ， 主 机 会 置 位 选 通 线 
为 =5Vs 

在 有 “ 轻 度 ”(mild ) 衰减 的 情况 下 ， 打 印 机 的 速度 可 能 会 减 慢 以 检测 nstrobe 信号， 
或 者 主机 的 速度 变 慢 以 检测 naAck 信号 。 如 果 连 接 的 是 打印 机 ， 这 种 速度 上 的 滞 阻 现象 几乎 
很 难 被 察觉 到 。 但 在 并 行 磁盘 接口 上 的 速度 变 慢 就 会 带 来 影响 ， 因 为 我 们 通常 希望 得 到 瞬 
时 响应 。 

如 果 使 用 一 根 很 长 的 传输 电缆 ， 在 打印 机 的 终端 可 能 会 收 到 完全 不 同 的 电压 信号 。 当 信和 号 
到 达 打 印 机 时 ,“ 高 ” 电 平 可 能 是 +1V， 而 “ 低 ” 电 平 可 能 是 -3V。 如 果 +1V 电压 并 不 足以 
高 于 人 逻辑 1 的 门限 电压 ， 那 么 在 打印 机 的 信号 处 理 过 程 中 ， 我 们 就 会 在 应 该 输出 一 个 1 的 地 方 
得 到 一 个 0 的 结果 。 同 样 ， 经 过 了 长 距离 的 传输 后 ， 选 通信 号 可 能 会 在 数据 位 信号 到 达 之 前 进 
入 打印 机 。 在 这 种 情形 下 ， 打 印 机 就 会 对 检测 到 nstrobe 信号 有 效 时 放置 在 数据 线 上 的 各 种 
信号 进行 打印 。( 这 时 ， 可 能 发 生 的 极端 情况 是 一 个 文本 字符 被 误 认 为 是 一 个 控制 字符 。 这 样 
就 可 能 引起 打印 机 输出 乱码 和 出 现 死机 的 情况 。) 


7. 5.2 串 行 数 据 传 输 


从 上 面 的 描述 我 们 可 以 看 到 ， 并 行 数据 传输 是 沿 着 数据 总 线 每 次 移动 一 个 字 节 。 在 并 行 数 
据 传输 中 ， 每 一 位 数据 都 要 求 有 一 根 数据 线 ， 并 且 这 些 数 据 线 由 一 根 独立 的 选 通 线 脉冲 来 激 
活 。 与 并 行 数据 传输 不 同 ， 串 行 数据 传 输 只 用 一 根 导线 来 发 送 数据 ， 每 次 只 能 传送 一 位 数据 ， 
就 像 单数 据 线 上 的 脉冲 信号 。 当 然 ， 串 行 数据 传输 还 需要 有 其 他 一 些 导 线 来 传送 由 协议 所 定义 
的 特殊 信号 。RS-232-C 就 是 这 样 的 一 个 串 行 通 信 协 议 ， 它 要 求 有 独立 的 信号 线 。 但 是 ， 数 据 
发 送 仍然 只 用 一 条 数据 线 ( 参 见 第 12 章 ) 。 串 行 存 储 接口 会 将 这 些 特 殊 的 信号 加 入 沿 着 数据 通 
路 进行 交换 的 协议 帧 中 。 在 第 13 章 中 将 仔细 研究 一 些 串 行 存储 协议 。 一 般 而 言 ， 串 行 数据 流 
比 并 行 数据 传输 得 更 快 、 更 长 、 更 可 靠 。 对 于 高 性 能 接口 ， 这 提供 了 一 种 进行 串 行 传输 的 
方法 。 

串 行 传输 方法 也 可 以 用 作 时 间 敏 感 的 同步 数据 传输 。 同 步 协议 主要 用 于 传送 实时 数据 ， 比 
如 音频 和 视频 信号 。 因 为 音频 和 视频 信号 主要 由 人 的 感官 来 接收 ， 所 以 偶尔 的 一 点 传输 错误 并 
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不 会 造成 重大 的 影响 。 数 据 的 这 种 近似 特性 允许 有 少量 的 错误 控制 。 因 此 ， 这 种 从 源 端 发 送 到 
目标 端的 数据 流 可 以 具有 最 小 的 由 于 协议 造成 的 延迟 时 间 。 


7.6 磁盘 技术 


在 磁盘 驱动 器 技术 出 现 之 前 ,顺序 存储 介质 ( 如 穿孔 卡片 、 磁 带 和 纸 带 ) 是 唯一 可 用 的 
且 具 有 持久 性 的 存储 介质 。 如 果 某 个 用 户 所 需 的 数据 写 在 磁带 卷轴 的 尾部 ， 则 需要 读 取 整 
卷 磁带 才能 读 取 到 它 ， 并 且 每 次 都 只 能 阅读 一 个 记录 。 速 度 迟 缓 的 阅读 器 和 小 的 系统 内 存 
常常 使 数据 的 读 取 过 程 极其 缓慢 。 磁 带 和 卡片 不 但 处 理 速 度 很 慢 ， 而 且 由 于 它们 所 处 的 环 
境 及 其 物理 特性 的 影响 ， 性 能 也 会 很 快 衰减 。 纸 带 使 用 时 总 是 绷 紧 ， 所 以 容易 断裂 。 开 
放 的 卷轴 磁带 不 仅 会 绷 紧 ， 而 且 容 易 被 操作 人 员 误 处 理 。 卡 片 可 能 会 被 撕 碎 、 丢 失 和 
折 坏 。 

在 存储 技术 的 发 展 过 程 中 ， 不 难看 出 ，1956 年 IBM 公司 发 布 的 第 一 台 商 用 磁盘 计算 机 已 
经 彻底 改变 了 计算 机 世界 。 这 人 台 机 器 被 称 为 使 用 随机 访问 方法 的 控制 计算 机 ， 简 称 为 RAMAC 。 
按照 今天 的 标准 ， 早 期 计算 机 使 用 的 磁盘 体积 巨大 并 且 速 度 缓慢 ， 这 是 我 们 所 难以 理解 的 。 当 
时 ， 每 个 磁盘 的 直径 尺寸 为 24in( 约 6lem) ， 但 是 磁盘 的 每 一 面 却 仅 能 容纳 50 000 个 7 位 字符 。 
可 以 想象 一 下 ，50 个 双 面 磁盘 安装 在 一 根 转轴 上 ， 并 用 一 个 闪闪 发 光 的 玻璃 单 包 围 起 来 ,其 
大 小 与 一 间 花 园 小 屋 差 不 多 。 在 每 个 转轴 上 磁盘 的 总 存储 容量 约 为 500 万 字符 ， 每 次 访问 磁盘 
上 的 数据 ， 平 均 需 要 1s 的 时 间 。 这 种 磁盘 驱动 器 的 总 重量 超过 1t， 并 且 制 造成 本 需要 几 百 万 
美元 。( 当时 ,没有 人 会 从 IBM 购买 这 些 设备 。) 

相 比 之 下 ， 到 了 2000 年 年 初 ，IBM 公司 开始 推销 一 种 用 于 掌上 电脑 和 数码 相机 的 高 容量 
磁盘 驱动 器 。 这 些 磁盘 的 直径 仅 为 ln( 约 2.54cm) ， 并 且 能 保存 1CB 的 数据 ， 而 数据 的 平均 访 
问 时 间 只 有 1Sms。 这 种 磁盘 驱动 器 的 重量 不 足 1oz( 约 28g) ， 而 零售 价格 低 于 300 美元 。 此 后 ， 
其 他 制造 商 生 产 了 更 便宜 同时 容纳 更 多 数据 的 lin 驱动 器 。 

因为 每 个 磁盘 扇 区 上 的 存储 单元 扇 区 都 有 一 个 独特 的 地 址 ， 它 可 以 独立 访问 周围 扇 区 ， 所 
以 磁盘 驱动 器 被 称 为 随机 (有 时 是 直接 ) 存 储 设备 。 如 图 7-13 所 示 ， 扇 区 中 的 同心 圆 称 为 磁道 。 
在 大 多 数 系 统 中 ， 每 个 磁道 包含 着 相同 数量 的 扇 区 。 每 个 扇 区 包含 相同 数量 的 字 节 数 。 因 此 ， 
在 磁盘 中 心 的 数据 比 磁盘 外 边缘 写 得 更 “密集 ”。 
一 些 生 产 商 通过 使 所 有 扇 区 大 小 大 致 相同 来 把 更 多 
的 字 节 放 在 磁盘 上 ， 这 样 在 外 部 磁道 上 比 内 部 磁道 
有 更 多 的 扇 区 。 这 就 是 所 谓 的 区 位 记录 。 一 般 很 少 
使 用 区 位 记录 ， 因 为 比 起 传统 的 系统 它 需 要 更 先进 
的 电子 驱动 控制 。 

磁道 是 从 磁盘 最 外 边 的 磁道 0 开始 连续 编号 的 。 
然而 ， 在 一 条 磁道 的 圆周 上 ， 扇 区 的 分 配 顺序 可 能 
不 是 连续 的 。 它 们 有 时 “ 跳 来 跳 去 ”， 这 样 允 许 驱 
动 器 电路 在 读 取 下 一 个 扇 区 之 前 有 时 间 处 理 完 扇 区 
进程 中 的 内 容 。 这 种 方法 称 为 交叉 存储 技术 。 根 据 
磁盘 的 旋转 速度 和 磁盘 电路 的 速度 以 及 缓冲 区 的 大 
小 不 同 ， 这 种 交叉 存储 技术 会 有 所 变化 。 当 今 大 多 
数 的 硬盘 驱动 器 在 读 取 磁 盘 时 采用 一 次 读 取 一 条 磁 纠 错 码 (ECC) 

道 的 方式 ， 而 不 是 一 次 读 取 一 个 让 区 ， 因 此 ， 交 叉 。 图 7.13 展示 鹿 区 之 间 间 隔 和 四 辑 记 区 
变 得 越 来 越 少 。 格式 的 磁盘 遍 区 








7.6.1 硬盘 驱动 器 


硬 ( 硬 或 固定 ) 盘 包 括 控制 电路 和 一 个 或 多 个 称 为 碟 片 的 金属 或 玻璃 盘 片 。 这 些 盘 片上 镀 
有 一 层 薄 的 磁性 材料 。 磁 盘 碟 片 堆 释 在 转轴 上 ， 通 过 传动 箱 中 的 一 个 电动 机 来 带动 旋转 。 磁 盘 
的 旋转 速度 可 以 达到 15 000r/min， 典 型 的 磁盘 转速 为 5400r/min 和 7200r/min。 磁 盘 的 读 / 写 头 
通常 安装 在 一 个 旋转 的 磁盘 驱动 臂 上 ， 磁盘 驱动 臂 通过 其 转轴 上 缠绕 的 线圈 的 感应 磁场 来 进行 
准确 的 定位 (参见 图 7-14)。 如 果 给 驱动 臂 提供 能 量 ， 则 整个 梳 状 的 读 / 写 头 就 可 以 向 磁盘 的 中 
心 移动 ， 或 者 是 从 磁盘 的 中 心 移 开 。 ew 

尽管 磁盘 技术 得 到 了 持续 的 发 展 , 但 是 我 
们 现在 还 不 能 大 批量 生产 完全 无 差错 的 介质 。 
尽管 出 错 的 概率 非常 小 ,但 是 出 错 总 是 难免 
的 。 目 前 ， 我 们 采用 两 种 机 制 来 减少 磁盘 表面 
可 能 出 现 的 错误 : 对 数据 本 身 进行 特殊 编码 和 
使 用 纠 错 算 法 (这 种 特殊 的 编码 方式 和 某 些 纠 
错 校 验 编码 方法 在 第 2 章 中 已 经 讨论 过 ) 。 这 
些 工 作 将 由 磁盘 控制 器 硬件 中 的 特殊 电路 来 处 
理 。 而 磁盘 控制 器 中 的 其 他 电路 负责 磁头 定位 
和 磁盘 时 序 。 

对 于 一 个 堆 秋 的 磁盘 盘 片 ， 磁 盘 上 的 各 个 图 7-14 硬盘 驱动 臂 ( 带 有 读 / 写 头 ) 和 磁盘 
磁道 应 上 下 一 一 对 应 ， 形 成 一 个 圆柱 面 。 一 组 梳 状 的 读 / 写 头 每 次 可 以 访问 一 个 柱 面 。 柱 面 描 
述 的 是 每 个 磁盘 上 的 环 状 区 域 。 

通常 ， 磁 盘 的 可 用 面 上 都 有 一 个 读 / 写 头 。( 一 些 老式 磁盘 系统 (特别 是 某 些 移动 磁盘 ) 最 
上 层 碟 片 的 上 表面 和 最 下 层 碟 片 的 下 表面 常常 都 是 不 用 的 。) 硬盘 磁头 从 来 都 不 会 触及 磁盘 的 表 
面 ， 而 是 悬浮 在 磁盘 表面 的 上 方 ， 它 们 之 间 仅 仅 相 隔 几 个 微米 厚 的 空气 层 。 当 磁盘 系统 断 电 
后 ， 磁 头 退 到 一 个 安全 的 地 方 。 这 一 过 程 称 为 停靠 磁头 。 如 果 读 / 写 头 接触 到 磁盘 表面 ， 则 磁 
盘 将 损坏 。 这 种 情况 称 为 磁头 碰撞 。 

磁头 碰撞 在 早期 的 磁盘 驱动 器 中 是 很 常见 的 现象 。 在 第 一 代 磁 盘 系 统 中 ， 驱 动 器 的 机 械 部 
件 和 电子 组 件 的 价格 与 磁盘 碟 片 相 比 ， 都 是 非常 昂贵 的 。 为 了 用 最 少 的 资金 提供 最 大 的 存储 容 
量 ， 计 算 机 制造 商 使 用 了 一 种 称 为 磁盘 组 的 可 移动 磁盘 来 制造 磁盘 驱动 器 。 然 而 ， 如 果 打 开 驱 
动 器 的 密封 外 壳 ， 则 各 种 空气 中 的 杂质 ， 如 灰 竺 和 水 汽 都 会 进入 到 磁盘 密封 过 中 。 结 果 ， 在 磁 
头 与 磁盘 之 间 需 要 留 有 大 的 间隙 来 防止 杂质 导致 磁头 碰撞 。( 尽 管 在 磁头 和 磁盘 之 间 留 有 了 较 
大 的 间隙 ， 但 是 磁头 碰撞 事件 仍然 会 持续 发 生 ， 以 至 于 某 些 公司 由 此 所 经 历 的 停工 时 间 几 乎 与 
生产 时 间 一 样 长 。) 当然 ， 加 大 磁头 到 磁盘 之 间 的 空 除 ， 实 际 上 是 降低 了 数据 的 存储 密度 。 磁 头 
到 磁盘 的 距离 越 大 ， 则 在 磁盘 的 磁 通 涂 层 中 需要 更 强 的 磁 荷 来 感应 读 取 所 需 的 数据 。 要 得 到 更 
强 的 磁 荷 ， 就 需要 有 更 多 的 磁 介 质粒 子 来 参与 磁 通 量 的 转变 过 程 ， 这 样 就 会 降低 磁盘 驱动 器 上 
的 数据 密度 。 

后 来 ， 由 于 控制 器 电路 和 机 械 组 件 的 成 本 大 幅度 下 降 ， 使 得 密封 式 磁盘 系统 得 到 了 广泛 
的 应 用 。IBM 公司 最 先 发 明 了 这 种 技术 ， 当 时 开发 这 种 技术 使 用 的 是 “ 温 彻 斯 特 ” 编 码 。 
因此 ， 温 彻 斯 特 很 快 变 成 了 密封 式 磁盘 的 代名词 。 今 天 , 没有 人 再 生产 可 移动 磁盘 组 的 驱 
动 器 ， 所 以 我 们 也 没有 必要 对 磁盘 进行 区 分 。 密 封 式 驱 动 器 允许 磁头 到 磁盘 的 间隙 靠 得 更 
近 ， 因 而 增加 了 数据 的 存储 密度 以 及 提高 了 磁盘 的 旋转 速度 。 这 些 要 素 构成 了 硬盘 驱动 器 
的 性 能 特征 。 
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寻 道 时 间 是 指 磁盘 驱动 臂 定 位 到 指定 磁道 上 所 需 的 时 间 。 寻 道 时 间 并 不 包括 磁头 读 取 磁盘 
目录 的 时 间 。 磁 盘 目录 将 逻辑 文件 信息 (例如 my_tory .aoc ) 上 映射 到 对 应 的 物理 扇 区 地 址 上 
(例如 柱 面 7、 表 面 3、 扇 区 72) 。 一 些 高 性 能 磁盘 驱动 器 会 在 磁盘 每 个 可 用 面 的 每 个 磁道 上 都 
提供 一 个 读 / 写 头 ， 这 样 实 际 上 可 以 消除 寻 道 时 间 。 由 于 这 种 系统 中 没有 可 移动 的 驱动 臂 ， 所 
以 访问 数据 时 唯一 可 能 的 延迟 是 磁盘 的 旋转 延迟 。 

旋转 延迟 是 读 / 写 头 定位 到 指定 扇 区 上 方 所 需要 的 时 间 。 旋 转 延 迟 时 间 与 寻 道 时 间 的 和 称 
为 存 取 时 间 。 如 果 将 存 取 时 间 与 从 磁盘 上 实际 读 取 数 据 所 需要 的 时 间 相 加 ， 就 得 到 了 传输 时 
间 。 当 然 ， 传 输 时 间 取 决 于 所 要 读 取 的 数据 量 。 反 应 时 间 是 旋转 速度 的 直接 函数 。 当 驱动 臂 定 
位 到 目标 磁道 后 ， 反 应 时 间 用 来 衡量 目标 扇 区 移动 到 读 / 写 头 下 方位 置 所 需要 的 时 间 总 量 。 通 
常 引 用 平均 数 表 示 ， 计 算 公 式 如 下 : 

( 60s | ems) /2 
磁盘 旋转 速度 s 
为 了 对 上 面 这 些 术 语 有 全 面 的 了 解 ， 图 7-15 给 出 了 一 个 典型 的 磁盘 的 说 明 书 。 
可 靠 性 和 维护 : 


1500GB MTTF 300 000h 
启动 /停止 循环 次 数 50 000 


5 年 (最 少 ) 

数据 差错 率 

(不 可 修复 每 读 100 位 小 于 1 
基本 性 能 : 

寻 道 时 间 
道 - 道 

1462Kbpi 读 0.3ms 
512 写 0.5ms 
63 Se 





4.5ms 


26.1mm 写 5.0ms 
147.0mm 平均 反应 时 间 4.17ms 
转速 


101.6mm 
720g (+/-0.20%0) 7200rmin 


重量 
温度 范围 (C) 数据 传输 率 : 
工作 时 5~55C 读 出 1.2MB/s 


贮存 时 -40~71C 写 入 3GB/s 
相对 湿度 5%~95% 启动 时 间 : 
噪声 33dBA， 空 闲 状态 | (0 至 稳定 ) 9s 


250mA 1.6W 


图 7-15 由 磁盘 驱动 器 制造 商 提供 的 典型 的 磁盘 说 明 书 


因为 在 每 次 执行 读 写 操作 之 前 都 必须 先 读 取 磁 盘 目 录 ， 所 以 磁盘 目录 的 存放 位 置 对 磁盘 驱 
动 器 的 整体 性 能 有 重大 的 影响 。 由 于 磁盘 的 最 外 层 磁 道 在 相同 面积 内 具有 最 低 的 位 密度 ， 因 此 
与 内 层 磁道 相 比 ， 这 些 区 域 最 不 容易 出 现 位 错误 。 为 了 保证 最 高 的 可 靠 性 ， 磁 盘 目录 可 以 存放 
在 最 外 层 的 磁道 0 上 。 这 就 意味 着 ， 在 每 次 执行 存 取 操作 时 ， 驱 动 臂 都 必须 向 外 摆动 到 磁道 0， 
然后 再 回 到 所 需 的 磁道 上 。 因 此 ， 了 驱动 臂 大 跨度 的 移动 在 很 大 程度 上 可 能 会 影响 磁盘 系统 的 








性 能 。 

随 着 记录 技术 和 纠 错 算法 的 发 展 ， 现 在 已 经 允许 将 磁盘 目录 放 到 能 够 提供 最 佳 性 能 的 位 置 
上 : 即 放 在 最 里 面 的 磁道 上 。 这 种 方法 可 以 充分 减少 驱动 臂 的 移动 距离 ， 提 供 最 大 可 能 的 吞吐 
量 。 因 此 ， 有 一 些 ( 但 不 是 全 部 ) 现 代 磁 盘 系 统 在 中 央 磁 道上 存放 磁盘 目录 。 

目录 存放 位 置 是 磁盘 逻辑 组 织 的 一 个 要 素 。 和 磁盘 的 逻辑 组 织 与 磁盘 的 操作 系统 密切 相关 。 
磁盘 逻辑 组 织 的 一 个 主要 方面 是 哪些 扇 区 存在 映射 关系 。 由 于 硬盘 包括 很 多 的 扇 区 ， 所 以 不 可 
能 为 每 个 扇 区 都 保存 一 个 标记 。 下 面 ， 我 们 考虑 在 图 7-15 所 示 的 数据 表 中 描述 的 磁盘 。 磁 盘 
系统 有 8 个 表面 ， 每 个 表面 有 48 000 条 磁道 ， 而 每 个 磁道 包含 746 个 扇 区 。 这 就 意味 着 ， 在 磁 
盘 系统 中 共有 2. 86 亿 个 扇 区 。 如 果 用 一 个 分 配 表 来 列 出 每 个 扇 区 的 状态 ， 并 且 用 1 个 字 节 来 
记录 每 个 状态 ， 那 么 将 会 要 占用 超过 200MB 的 磁盘 空间 。 这 种 做 法 不 仅 要 花费 大 量 的 磁盘 空 
间 开 销 ， 而 且 当 需要 检查 某 个 扇 区 的 状态 时 ， 读 取 数 据 结构 无 疑 也 会 或 多 或 少 地 消耗 一 定 的 时 
间 。( 显 然 ， 检 查 扇 区 状态 是 一 个 需要 频繁 执行 的 任务 。) 正 是 因为 这 个 原因 ， 操 作 系统 以 群 组 
的 形式 为 扇 区 分 配 地 址 ， 称 为 块 (或 复 ) 。 采 用 这 种 地 址 分 配方 式 可 以 使 文件 管理 变 得 更 加 简 
单 。 每 个 区 块 中 扇 区 的 数目 决定 了 分 配 表 的 大 小 。 如 果 分 配 的 区 块 越 小 ， 则 一 个 文件 不 能 装 满 
整个 区 块 时 ， 浪 费 的 磁盘 空间 也 就 越 少 。 但 是 ， 如 果 分 配 的 块 太 小 ， 分 配 表 就 会 变 得 很 大 ， 而 
且 查 找 的 速度 也 会 变 得 很 慢 。 在 下 一 节 中 我 们 将 讨论 在 软盘 中 目录 和 文件 分 配 结构 之 间 的 
关系 。 

图 7-15 所 示 的 磁盘 规格 说 明 书 中 最 后 要 讨论 的 一 点 是 : 标题 “可 靠 性 和 维护 ”下 对 磁盘 
可 靠 性 的 各 种 估计 。 根 据 制造 厂商 的 说 法 ， 这 种 特殊 设计 的 磁盘 驱动 器 的 使 用 期 限 为 5 年 ， 并 
且 人 允许 系统 启 停 50 000 次 。 同 样 ， 在 这 个 标题 下 ， 系 统 的 平均 失效 时 间 ( MTTF ) 是 300 000h。 
可 以 肯定 ， 该 数字 并 不 表示 这 种 磁盘 驱动 器 的 期 望 寿命 是 300 000h。 如 果 磁 盘 持 续 运 行 ， 这 将 
会 超过 34 年 。 这 个 规格 说 明 书 很 清楚 地 表明 了 这 种 磁盘 驱动 器 的 设计 寿命 为 5 年 。 这 种 明显 
的 差异 是 由 于 采用 了 制造 业界 内 通行 的 统计 质量 管理 方法 所 造成 的 。 除 非 这 种 磁盘 是 根据 政府 
的 合同 制造 的 ， 否 则 用 来 计算 MTTF 的 确切 方法 完全 是 由 制造 厂商 来 决定 的 。 通 常 ， 这 个 计算 
过 程 包括 : 从 生产 线 上 随机 取样 ， 并 在 一 些 不 太 理想 的 条 件 下 将 磁盘 系统 运行 一 定 的 时 间 ， 通 
常 大 于 100 小 时 。 然 后 将 失效 数 描绘 成 概率 曲线 ， 最 后 得 到 MTTF。 简 言 之 ， 规 格 说 明 书 中 的 
“设计 寿命 ”更 可 信和 容易 理解 。 


7.6.2 固态 硬盘 


磁盘 的 局 限 性 很 多 。 首 先 ， 从 磁盘 中 检索 数据 比 从 主 存 中 检索 数据 需要 更 长 的 时 间 一 一 大 
约 为 100 万 倍 。 磁 盘 易 碎 ， 即 使 是 “加 固 型 ”也 能 在 强烈 震动 下 破裂 。 它 们 的 许多 移动 部 件 易 
受 磨 损 和 破坏 。 而 且 对 于 移动 设备 来 说 ， 磁 盘 功 耗 是 个 十 分 棘手 的 问题 。 

解决 这 些 问题 的 明确 方案 是 用 非 易 失 性 RAM 替换 人 硬盘。 事实 上 ， 这 种 替换 已 发 生 在 几 十 
年 前 的 超 高 性 能 计算 机 中 。 最 近 存储 材料 价格 的 降低 ， 使 它 成 为 一 个 在 工业 、 军 事 和 消费 产品 
中 有 吸引 力 的 选择 。 

固态 硬盘 (SSD) 由 微 控制 器 和 闪存 组 成 ， 这 种 内 存 是 基于 NAND 或 NOR 型 存储 髓 阵列 的 。 
闪存 与 标准 存储 器 的 区 别 在 于 它 必 须 先 擦 除 (“ 在 闪存 中 ” ) ， 然 后 才能 写 人 。 基 于 NOR 的 闪存 
是 字 节 寻 址 的 ， 这 使 其 比 基 于 NAND 的 闪存 更 为 昂贵 ， 而 基于 NAND 的 闪存 则 以 块 ( 称 为 页 ) 
为 单位 ， 这 非常 像 磁盘 。 

当然 ， 我 们 都 喜欢 口袋 大 小 的 记忆 棒 、 拇 指 驱 动 器 和 跳 转 驱动 器 (Jump Drives) 。 我 们 几 
乎 不 知道 这 些小 型 设备 可 以 在 钥匙 圈 上 存储 整个 图 书馆 。 由 于 其 具有 低 功 耗 和 耐久 性 ， 内 
存 驱动 器 现在 正在 替代 便携 式 设备 中 的 标准 磁盘 。 这 些 应 用 程序 也 受益 于 性 能 的 提升 : SSD 
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的 访问 时 间 和 传输 速率 通常 比 传统 磁盘 驱动 器 快 100 倍 。 然 而 ，SSD 仍然 比 RAM 慢 10 
万 倍 1 

虽然 SSD 的 数据 容量 已 经 接近 磁盘 的 数据 容量 ,但 它 的 成 本 往往 要 比 磁盘 高 出 2~3 售 。 

人 们 会 期 望 随 着 SSD 技术 的 不 断 进步 ， 它 们 的 价格 差距 将 会 逐渐 缩小 。 对 于 数据 中 心 来 说 ， 大 

型 SSD 阵列 的 成 本 增加 可 能 会 被 电力 和 空 的 费用 的 减少 所 抵消 

除了 成 本 之 外 ， 与 磁盘 相 比 SSD 的 另 一 个 缺点 是 闪存 的 位 元 在 对 页 面 进行 30 000 ~ 
1 000 000 次 更 新 之 后 就 会 磨损 。 只 要 SSD 不 存储 易 变 性 高 的 数据 (如 虚拟 存储 器 的 页 面 文件 
等 ) ， 这 个 次 数 可 能 看 起 来 像 是 一 个 比较 长 的 工作 周期 。 标 准 磁盘 倾向 于 重复 使 用 相同 的 磁盘 
扇 区 ， 逐 渐 填 充 磁盘 。 如 果 这 种 方法 用 于 SSD 中 ， 那 么 部 分 驱动 器 将 会 磨损 并 变 得 不 可 用 。 因 
此 ， 为 了 延长 磁盘 的 使 用 寿命 ， 人 们 使 用 了 一 种 称 为 磨损 均衡 的 技术 ， 在 整个 磁盘 上 均匀 地 分 
布 数据 和 擦 除 / 写 入 周期 。 驱 动 器 内 兽 的 微 控制 器 管 理 磁 盘 上 的 可 用 空间 ， 来 确保 页 面 以 循环 
型 旋转 重复 使 用 。 这 种 方法 确实 提供 了 轻微 的 性 能 优势 。 由 于 页 面 必须 在 写 入 之 前 被 擦 除 ， 所 
以 如 果 不 重复 使 用 同一 页 面 ， 擦 除 和 写 入 可 能 会 同时 发 生 

专 为 服务 器 使 用 的 SSD 称 为 企业 级 固态 硬盘 。 这 些 SSD 包括 最 佳 性 能 的 高 速 缓存 和 小 型 
备用 电源 ， 以 便 在 电源 故障 的 情况 下 可 将 缓存 内 容 提 交 到 闪存 。 图 7-16 所 示 为 Intel 910 800GB 
SSD 的 照片 。 微 控制 器 和 闪存 芯片 主 室 了 卡 的 状态 。 驱 动 器 像 任何 其 他 总 线 附加 卡 一 样 安装 在 
服务 器 中 








电容 器 人 微 控制 器 


图 7-16 Intel 910 800GB 固态 硬盘 


来 源 : 由 Intel 提供 


SSD 与 HDD 有 许多 共同 的 特点 。 图 7-17 所 示 为 企业 级 SSD 的 说 明 书 。 比 较 图 7-17 与 
图 7-15 中 的 规格 ， 可 以 看 出 没有 提 到 盘 片 、 转 速 或 其 他 任何 与 磁盘 旋转 有 关 的 因素 。 然 而 ， 驱 
动 需 的 物理 特性 、 访 问 时 间 、 传 输 速率 和 功 耗 仍然 是 重要 的 指标 

联合 电子 设备 工程 委员 会 (JEDEC) 制定 了 SSD 性 能 和 可 靠 性 指标 的 标准 。 其 中 最 重要 的 
两 个 是 不 可 恢复 的 误 码 率 ( UBER) 和 写 入 的 百 万 兆 字 节 (TBW) 。UBER 为 数据 错误 的 数量 除 以 
在 整个 使 用 期 内 模拟 所 得 的 读 取 的 总 位 数 。TBW 是 在 磁盘 无 法 满足 说 明 书 中 的 速度 和 错误 率 
之 前 可 写 入 磁盘 的 百 万 兆 字 节 数 。TBW 是 磁盘 耐久 性 ( 或 使 用 寿 命 ) 的 度量 ，UBER 是 磁盘 可 
徘 性 的 度量 

企业 级 SSD 所 花费 的 成 本 只 有 在 进行 快速 数据 检索 时 才 是 有 意义 的 。 现 在 普遍 的 做 法 是 通 
过 短 行程 将 HDD 性 能 推 向 极限 。 使 用 短 行程 涉及 安装 许多 额外 的 磁盘 驱动 器 ， 每 个 磁盘 驱动 
器 仅 使 用 其 柱 面 的 小 部 分 ， 从 而 将 驱 ee 动 保持 在 最 小 。 了 驱动 臂 运 动 减 少 ， 访 问 时 间 减 少 ， 
访问 每 个 磁盘 可 以 节省 几 毫 秒 。 因 此 ,企业 级 HDD 和 SSD 之 间 的 成 本 比较 必须 考虑 企业 级 
SDD 千 兆 字 节 的 有 用 存 os 、 一 般 可 靠 性 和 低 功 耗 

随 着 驱动 器 价格 的 持续 下 滑 ， 固 态 硬 盘 开 始 出 现在 不 太 苛 刻 的 业务 环境 中 
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系统 配置 : 可 靠 性 和 维护 : 
格式 化 容量 /GB 800 MTTF 2 000 000h 
集成 控制 器 SATA3.0 耐用 性 450TBW 
加 密 AES 256 位 数据 保留 3 个 月 
缓存 大 小 1GB 数据 出 错 〈 误 码 率 ) 每 读 107 位 小 于 1 
每 个 书 区 的 字 节 数 512 基本 性 能 : 
物理 性 能 : 平均 延迟 ( 顺序 ) 
7mm 读 50hs 
100mm 写 65Shs 
70mm IO 操作 ( IOPS ) (随机 ) 
重量 170g 8KB 读 取 47 500 IOPS 
温度 范围 ( 尺 ) 8KB 写 入 5 500 IOPS 


工作 时 0~70TC 数据 传输 率 : 
不 工作 /存储 时 55 一 905 心 读 500MB/s 
相对 湿度 5%~95% 写 450MB/s 
0dB 启动 时 间 : 
(0 至 驱动 就 绪 ) 3s 





图 7-17 SSD 的 说 明 书 


A A 


现在 ， 光 学 存储 器 系统 实际 上 可 以 提供 无 限制 的 存储 容量 ， 而 价格 又 具备 与 磁带 竞争 的 能 
力 。 光 盘 具 有 多 种 格式 ， 最 流行 的 是 大 家 普遍 使 用 的 只 读 光 盘 驱动 器 ( CD- ROM ) 。CD- ROM 
能 够 保存 超过 0. 5G 的 数据 。CD-ROM 是 一 种 只 读 存 储 介质 ， 用 来 存储 软件 和 数据 是 非常 理想 
的 。 可 记录 CD( CD-R) 、 可 复写 CD( CD- RW) 和 一 次 写 入 多 次 读 取 ( WORM ) 磁盘 也 都 是 光学 
存储 设备 ， 通 常用 作 长 期 数据 的 存档 和 大 量 数据 的 输出 。CD-R 和 WORM 为 文档 和 数据 提供 了 
大 容量 的 防 算 改 存储 器 。 为 了 数据 的 长 期 归档 存储 ， 一 些 计算 机 系统 会 直接 将 数据 输出 到 光学 
存储 器 ， 而 不 是 打印 纸 或 微缩 胶片 上 。 这 种 光盘 称 为 计算 机 输出 激光 盘 ( COLD) 。 带 有 机 械 手 
的 自动 存储 库 系统 又 称 为 自动 光盘 柜 ， 它 可 以 直接 访问 大 量 的 光盘 。 自 动 光 盘 柜 可 以 存储 的 数 
据 达 到 几 百 张 光盘 ， 总 容量 可 达 50 ~ 1200GB， 或 者 更 多 。 光 盘存 储 器 的 支持 者 声称 光学 存储 
器 不 同 于 磁 介 质 ， 光 学 存储 器 能 够 储存 100 年 而 不 会 有 明显 的 性 能 衰退 。( 现在 ， 有 没有 其 他 
存储 器 来 挑战 这 种 说 法 呢 ?) 


7.7.1 CD-ROM 


CD-ROM 是 一 种 利用 聚 碳酸 醋 材 料 ( 塑料) 制造 的 光盘 。 光 盘 的 直径 大 小 为 120mm(4. 8in)， 
并 且 涂 敷 一 层 铝 反射 膜 。 铝 膜 上 面 有 一 层 丙 烯 酸 材料 的 保护 性 密封 涂 层 ， 以 防止 铝 膜 的 磨损 和 
腐蚀 。 光 盘 上 的 铝 层 会 反射 来 自 光盘 下 面 的 绿色 激光 二 极 管 所 发 射 的 光束 。 反 射 光 束 通过 一 个 
棱镜 ， 将 光线 偏转 到 一 个 光电 检测 器 上 。 光 电 检 测 器 把 光学 脉冲 转换 成 电信 号 ， 然 后 发 送 给 驱 
动 器 中 的 电 译 码 装置 ， 如 图 7-18 所 示 。 

将 数据 写 和 人 到 光盘 使 用 的 是 从 中 心 到 外 部 边缘 的 方式 ， 在 聚 碳酸 醋 基 片上 形成 一 条 四 凸 不 
平 的 单一 螺旋 状 的 轨道 ( 光 轨 ) 。 四 陷 的 区 域 称 为 四 坑 ， 因 为 从 CD 的 上 表面 来 看 它们 的 确 很 像 
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止 坑 。 在 止 坑 之 间 的 平 直 空间 称 为 平台 。 四 坑 的 斥 寸 为 0.5hm 宽 ，0.83 ~3.56pm 长 。( 四 坑 
的 边缘 位 置 对 应 于 二 进 制 数 1。) 从 凹 坑 底 部 到 凸 起 平台 的 高 度 为 绿色 激光 二 极 管 所 产生 激光 波 
长 的 四 分 之 一 。 这 意味 着 由 于 光 的 干涉 效应 会 导致 从 止 坑 反 射出 来 的 激光 束 与 来 自 激 光 器 的 人 
射 光 严格 相 消 。 这 就 导致 了 光 脉 冲 的 亮 和 暗 ， 它 能 由 驱动 器 电路 解释 为 二 进 制 数字 。 





图 7-18 CD-ROM 驱动 器 的 内 部 结构 


螺旋 光 轨 相 邻 圈 的 距离 称 为 轨道 间距 。 距 离 必须 大 于 1.6km( 参 见 图 7-19) 。 如 果 拆 开 一 
个 CD-ROM 或 者 音乐 CD， 并 把 数据 光 轨 平 铺 在 地 面 上 ， 那 么 由 止 坑 和 平台 组 成 的 数据 线 几 乎 
可 以 延伸 到 5mile(8km) 长 。( 但 是 ， 它 们 的 宽度 却 只 有 0.5um， 还 不 到 人 头发 丝 粗 细 的 一 半 ， 
这 用 肉眼 几乎 看 不 到 。) 





图 7-19 CD 的 螺旋 光 轨 和 轨道 放大 图 


尽管 一 个 CD 仅 有 一 条 光 轨 ， 但 是 在 大 多 光盘 数据 文献 中 都 将 由 止 坑 和 平台 线 旋 转 360° 构 
成 的 一 个 圆圈 视 为 一 个 光 轨 。 与 磁盘 存储 器 不 同 的 是 ， 光 盘 中 心 的 轨道 和 光盘 外 圈 的 轨道 都 有 
着 相同 的 位 密度 。 

最 初 设计 CD-ROM 用 来 存储 音乐 和 其 他 顺序 音频 信号 。 它 在 数据 存储 方面 的 应 用 是 人 们 
后 来 的 想法 ， 图 7-20 给 出 了 光盘 的 数据 扇 区 的 格式 。 可 以 看 到 ， 光 盘 上 的 数据 存储 在 名 为 扇 
区 的 2352 个 信息 块 中 ， 这 些 扇 区 沿 着 轨道 长 度 的 方向 排列 。 扇 区 由 98 个 588 位 的 基本 单元 组 
成 ， 这 些 基 本 单元 称 为 信道 帧 。 如 图 7-21 所 示 ， 信 道 帧 由 同步 信息 、 文 件 关 和 有 效 载 荷 的 33 
个 17 位 符号 组 成 。 其 中 ，17 位 符号 采用 的 是 一 个 RLL(2，10 ) 编码 方式 ， 称 为 EFM(8 到 14 
的 调制 编码 ) 。 光 盘 驱 动 器 读 取 和 解释 ( 称 为 解 调 ) 信 道 帧 ， 并 创建 另外 一 种 称 为 小 帧 的 数据 结 
构 。 一 个 小 帧 有 33 个 字 节 。 其 中 ， 用 户 数 据 占用 32 字 节 ， 剩 下 的 一 个 字 节 用 来 作为 子 信道 信 
息 。 这 里 ， 有 8 个 子 信道 ,分 别 命 名 为 P、Q、R、S、T、U、V 和 W。 除 了 子 信道 了 (表示 开始 
时 间 和 停止 时 间 ) 和 Q( 包 含 的 是 控制 信息 ) 外 ， 所 有 的 子 信道 只 对 音频 应 用 有 意义 。 








图 7-20 “CD 数据 扇 区 的 格式 









言 道 帧 
33 个 17 位 符号 







解 调 
98 个 小 帧 =1 扁 区 


交叉 交错 里 德 - 
有 效 载荷 所 罗 门 码 (CIRC) 










小 帧 编号 


EL ll i ye wo 
学 节 | 学 节 
2302 |2303 
字 节 | 字 节 
2326 | 2327 





图 7-21 CD 的 物理 格式 和 逻辑 格式 
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大 多 数 光 盘 以 恒定 的 线 速度 ( CLV) 来 操作 。 这 就 是 说 ,激光 经 过 各 个 扁 区 的 速率 保持 恒 
定 ， 而 不 管 这 些 扇 区 是 位 于 光盘 的 开始 部 分 还 是 结束 部 分 。 因 此 为 了 保持 恒定 的 线 速度 ， 在 访 
问 外 层 光 轨 时 光盘 的 旋转 速度 要 比 访问 内 层 光 轨 时 慢 。 一 个 扇 区 是 按照 激光 束 沿 着 光 轨 从 光盘 
开始 处 (光盘 中 央 ) 运 行 到 该 篇 区 所 需要 时 间 的 分 秒 数 来 编号 的 。 我 们 还 要 对 这 些 “ 分 秒 数 ” 
进行 定 标 ， 这 里 的 基本 假设 是 CD 播放 器 每 秒 处 理 75 个 扇 区 。 计 算 机 CD- ROM 驱动 器 的 速度 
已 经 比 音频 CD 速度 快 52 倍 (52 x ) 以 上 ， 为 7.8MB/s， 今 后 肯定 会 更 快 。 为 了 定位 到 指定 的 
鹿 区 上 ， 激 光头 的 滑动 支架 会 垂直 于 光 轨 的 方向 移动 ， 它 尽 可 能 准确 地 猜测 出 指定 扇 区 的 位 
置 。 在 随意 读 取 某 个 扇 区 后 ， 激 光头 沿 着 光 轨 到 达 指 定 的 扇 区 。 

光盘 中 的 扇 区 有 3 种 不 同 格式 ， 具 体 是 哪 种 格式 要 取决 于 记录 数据 所 用 的 模式 。 模 式 0 和 
模式 2 用 来 记录 音乐 ， 没有 纠 错 能 力 。 模 式 1 用 来 记录 数据 ， 有 两 级 错误 检测 和 校正 功能 。 这 
些 格式 的 具体 分 布 如 图 7-20 所 示 。 使 用 模式 1 记录 的 CD 的 总 容量 为 650MB 。 模 式 0 和 模式 2 
的 容量 则 为 742MB， 但 它们 不 能 用 来 可 靠 地 记录 数据 。 

如 果 使 用 多 时 间 段 记录 方式 ，CD 中 的 轨道 间距 可 以 大 于 1.6hm。 音 频 CD 在 各 个 时 间 段 
中 都 可 以 记录 不 同 的 歌曲 ， 如 果 从 下 面 看 ， 这 些 时 间 段 是 一 些 不 断 扩 大 的 同 中 心 环 。 当 CD 用 
作 数 据 存储 时 ， 这 种 在 音乐 中 “记录 时 间 段 ”的 思想 没有 进行 任何 修改 ， 就 直接 扩展 到 包括 
数据 记录 的 时 间 段 。CD 有 多 达 99 个 时 间 段 。 对 于 CD 的 各 个 时 间 段 的 界定 为 : 一 个 时 间 段 内 
包含 数据 内 容 表 的 4500 个 扇 区 (时 间 为 Imin) 引 入 和 结尾 部 分 的 一 个 6750 个 扇 区 或 者 2250 个 
扇 区 引出 。( 光 盘 上 的 第 一 个 时 间 段 有 6750 个 扇 区 引出 ， 而 后 面 其 他 的 时 间 段 的 引出 部 分 则 比 
较 短 。) 在 CD-ROM 上 ， 引 出 部 分 用 来 存放 段 内 数据 的 目录 信息 。 


12 DVD 


可 以 认为 数字 通用 光盘 或 DVD( 以 前 称 为 数字 视频 光盘 ) 是 CD 密度 的 4 倍 。DVD 的 旋转 
速度 约 为 CD 的 3 倍 。DVD 的 四 坑 尺 寸 大 约 是 CD 四 坑 (0.4 ~2.13pm) 的 一 半 ， 而 轨道 间距 为 
0.74pm。 像 CD 一 样 ，DVD 也 分 为 可 刻录 和 不 可 刻录 两 种 形式 。 与 CD 不 同 的 是 ，DVD 有 单 面 
或 双 面 ， 单 层 或 双 层 等 多 种 形式 。 通 过 重新 聚焦 激光 可 以 访问 每 层 ， 如 图 7-22 所 示 。 单 层 单 
面 DVD 的 存储 容量 为 4.78GB， 双 层 双 面 DVD 可 以 容纳 17GB 的 数据 。DVD 的 扇 区 大 小 为 2048 
字 节 ， 与 CD 一 样 支持 音乐 、 数 据 和 视频 3 种 数据 模式 。 由 于 具有 更 高 的 数据 密度 和 更 快 的 存 
取 速 度 ， 因 此 可 以 认为 DVD 最 终 将 取代 CD 成 为 长 期 数据 存储 和 信息 发 布 的 介质 。 









a 


a) b ) 
图 7-22 激光 聚焦 在 单 层 DVD a) 和 双 层 DVD b) 上 ， 一 次 一 层 


DVD 在 许多 方面 都 比 CD 有 所 改进 。 最 重要 的 是 DVD 使 用 650nm 长 的 激光 ， 而 CD 采用 
780nm 长 的 激光 。 这 意味 着 DVD 的 特征 尺寸 可 以 小 得 多 ， 因 此 每 位 占用 的 线性 空间 更 短 。CD 
上 最 短 凹 槽 的 长 度 为 0.83um， 而 DVD 上 的 最 短 四 柳 长 度 为 0.4pm， 因 此 DVD 轨道 可 以 放 得 
更 近 一 些 。DVD 上 的 轨道 间距 为 0.74pym， 而 CD 为 1.6km。 这 意味 着 DVD 上 的 螺旋 轨道 更 
长 。 之 前 提 到 过 ，CD 的 轨道 长 度 如 果 用 螺旋 线 展开 ， 其 长 度 大 约 Smile(8km) 。 相 比 之 下 ， 








DVD 的 轨道 展开 后 长 度 将 超过 7.35mile(11. 8km)。 

第 二 个 很 大 的 改进 是 DVD 的 轨道 格式 比 CD 的 轨道 格式 更 加 精简 。 此 外 ，DVD 具有 比 CD 
更 有 效 的 纠 错 算法 。DVD 纠 错 比 CD 减少 了 大 量 的 元 余 位 ， 并 提供 了 更 好 的 数据 保护 。 

由 于 具有 更 高 的 数据 密度 和 更 快 的 存 取 速度 ， 因 此 DVD 可 能 是 长 期 数据 存储 和 检索 的 理 
想 媒介 。 然 而 ,还 有 许多 其 他 媒介 正在 运行 。 


7.7.3 蓝光 光盘 

如 果 DVD 的 650nm 长 的 激光 提供 的 记录 密度 是 CD 的 750nm 长 的 激光 的 两 倍 以 上 ， 那 么 
波长 为 405nm 的 蓝 紫 色 激 光 就 会 突破 所 有 的 障碍 。 激 光 技 术 的 最 新 发 展 使 我 们 制造 出 了 廉价 的 
蓝光 光盘 驱动 器 ， 并 可 以 应 用 到 各 种 消费 产品 中 。 蓝 光 和 HD-DVD 这 两 种 不 兼容 的 蓝光 光盘 
格式 在 20 世纪 中 期 的 市 场 上 占 主导 地 位 。 每 种 都 有 自己 独特 的 优势 : HD-DVD 向 后 兼容 传统 
的 DVD, 但 蓝光 的 存储 容量 更 大 。 

蓝光 光盘 格式 由 蓝光 光盘 协会 开发 ， 该 协会 是 一 个 由 9 家 电子 消费 制造 商 组 成 的 联盟 。 该 
组 织 由 麻 省 理工 学 院 领 导 ， 包括 索尼 、 三 星 和 先锋 等 主要 公司 。 赣 光 光 盘 由 120mm 的 聚 碳酸 
酯 盘 组 成 ， 数 据 写 在 单个 螺旋 轨道 上 。 轨 道上 的 最 小 四 坑 长 度 为 0.13nm， 轨道 间距 为 
0. 32nm。 单 层 磁 盘 的 总 记录 容量 为 25GB。 在 磁盘 上 可 以 “ 堆 释 ”多 层 ( 最 多 可 以 写 人 6 层 )， 
只 有 双 层 磁盘 可 用 于 家 庭 使 用 。 由 于 索尼 在 电影 行业 中 占据 主导 地 位 ， 最 重要 的 是 发 布 了 索尼 
广 受 欢迎 的 PlayStation 3， 它 们 使 用 蓝光 光盘 进行 数据 存储 ， 因 此 蓝光 光盘 最 终 赢 得 了 蓝 紫 色 
光盘 格式 的 战斗 。 

对 于 工业 级 数据 存储 ， 索 尼 和 Plasmon 公司 都 发 布 了 专门 用 于 数据 存档 的 蓝 色 激 光 介 质 。 
这 两 种 产品 都 适用 于 大 型 数据 中 心 ， 因 此 对 传输 速度 进行 了 优化 (验证 的 最 高 速度 为 6MB/s ) 。 
索尼 的 专业 数据 光盘 (PDD) 和 Plasmon 的 第 二 代 超 密度 光学 ( UDO-2 ) 磁盘 可 以 分 别 存储 高 达 
23GB 和 60GB 的 数据 。 


7.7.4 光盘 记录 方式 
CD 和 DVD 有 不 同 的 记录 技术 。 最 经 济 也 是 最 普遍 的 方法 是 使 用 热 敏 染料 。 在 CD 中 ， 这 
种 染料 夹 在 聚 碳酸 醋 基 片 和 反射 涂 层 之 间 。 当 被 激光 发 出 的 光照 射 撞击 时 ， 这 种 染料 就 会 在 聚 
碳酸 酷 基 片 上 产生 一 个 凹 坑 ， 这 种 凹 坑 会 影响 CD 反射 层 的 光学 特性 。 
可 重 写 光学 介质 (如 CD-RW)， 则 是 采用 一 种 金属 合金 来 代替 CD-R 光盘 上 的 染料 和 反射 
涂 层 。 这 种 金属 合金 包括 不 稳定 元 素 ， 如 钢 、 蹄 、 锯 和 银 等 。 在 正常 状态 下 ， 这 种 合金 涂 层 可 
以 反射 激光 。 但 是 ， 如 果 利 用 激光 将 这 种 合金 加 热 到 500% ， 合 金 就 会 发 生 某 种 分 子 变 化 ， 并 
且 反 射 率 会 降低 (化 学 家 和 物理 学 家 把 这 种 过 程 称 为 相 变 ) 。 如 果 只 将 这 种 合金 涂 层 加 热 到 
200Y ， 那 么 合金 会 回 到 原来 的 反射 状态 。 这 样 一 来 ， 光 盘 上 的 数据 可 以 改变 多 次 。( 专家 提醒 
大 家 ， 利 用 相 变 原 理 的 CD“ 只 ”能 工作 1000 次 左右 。) 
WORM 驱动 器 通常 使 用 在 一 些 大 型 计算 机 系统 上 。WORM 系统 采用 了 比 个 人 使 用 的 光盘 
系统 更 高 能 量 的 激光 。 低 能 量 的 激光 用 来 读 取 数 据 ， 而 高 能 量 激光 则 用 于 不 同 也 是 更 持久 的 记 
录 方 法 。 其 中 的 3 种 方法 如 下 : 
e 烧 录 : 利用 高 能 量 激光 熔化 一 个 止 坑 ， 这 个 凹 坑 位 于 光盘 保护 层 之 间 的 反射 金属 涂 
层 里 。 

e 双 金 属 合金 : 在 光盘 表面 的 保护 涂 层 之 间 封 人 两 个 金属 涂 层 。 利 用 激光 将 这 两 种 金属 熔 
合 在 一 起 ， 这 会 引起 下 面 金属 层 的 反射 率 发 生 改 变 。 双 金属 合金 的 WORM 光盘 的 制造 
商 声 称 这 种 介质 可 以 完好 保存 100 年 。 
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。 成 泡 : 在 两 个 塑料 层 之 间 压 人 一 个 热 敏 材料 层 。 当 被 高 能 量 的 激光 照射 撞击 时 ， 热 敏 性 
材料 中 将 产生 气泡 ， 从 而 引起 反射 率 的 改变 。 

尽管 CD-ROM 、CD-R 和 CD-RW 光盘 可 以 使 用 相同 的 帧 格式 ， 但 CD-R 和 CD-RW 磁盘 在 
某 些 CD-ROM 驱动 器 上 可 能 无 法 读 取 数 据 。 产 生 这 种 不 兼容 性 的 原因 可 能 是 CD- ROM 光盘 上 
的 信息 总 是 要 被 记录 (或 压 入 ) 到 某 个 单 时 间 段 内 。 男 一 方面 ， 如 果 CD-R 和 CD-RW 光盘 能 够 
像 软 盘 一 样 按 增 量 方式 写 和 信息， 那么 它们 会 变 得 非常 有 用 。 第 一 个 CD- ROM 规范 是 ISO 
9660， 它 规定 了 单 时 间 段 的 记录 格式 ， 而 且 光 盘 的 总 段 数 不 能 多 于 99 个 。 人 们 很 快 认识 到 ISO 
9660 的 这 些 限 制 阻碍 了 光盘 产品 的 更 广泛 应 用 ， 于 是 ,一些 CD-R 和 CD-RW 的 主要 制造 厂商 
成 立 了 一 个 协会 来 协商 解决 这 个 问题 。 经 过 他 们 的 努力 ， 最 后 开发 了 一 种 通用 光盘 格式 规范 
(UDF) ， 这 种 光盘 记录 格式 不 限制 每 个 光盘 上 的 记录 时 间 段 的 数量 。 这 种 新 格式 的 核心 思想 
是 ， 用 一 个 浮动 的 内 容 表 来 替换 原来 那个 与 每 个 记录 时 间 段 相关 联 的 内 容 表 。 这 个 浮动 的 内 容 
表 称 为 虚拟 分 配 表 (VAT) ， 它 会 写 到 光盘 上 紧 跟 在 用 户 数据 的 最 后 一 个 扇 区 后 面 的 引出 部 分 。 
当 有 数据 需要 添加 到 前 面 某 个 已 有 内 容 的 记录 时 间 段 上 时 ， 我 们 可 以 在 新 数据 写 人 后 ， 对 VAT 
进行 重 写 。 这 样 的 写 和 过程 可 以 持续 下 去 ， 直 到 VAT 到 达 光 盘 的 最 后 一 个 可 用 扇 区 。 


7.8 磁带 


磁带 是 一 种 最 古老 和 最 经 济 的 大 容量 存储 设备 。 第 一 代 的 磁带 是 使 用 类 似 于 录音 机 磁带 的 
相同 材料 制造 而 成 的 。 这 种 磁带 是 在 0. Sin 宽 (1. 25cm) 的 醋酸 纤维 素 薄 膜 带 表面 涂 甫 一 层 磁性 
氧化 物 。 并 将 1200ft 长 的 这 种 材料 缠绕 在 一 根 卷轴 上 ， 然 后 手工 连接 到 磁带 驱动 器 。 这 种 磁带 
驱动 器 的 大 小 与 一 个 小 冰箱 相当 。 早 期 磁带 的 容量 一 般 低 于 11MB， 而 且 需 要 将 近 半 个 小 时 才 
能 读 或 者 写 完 整个 卷轴 。 

磁带 上 的 数据 记录 方式 是 每 次 写 入 一 个 字 节 ， 对 于 数据 的 每 位 都 要 创建 一 个 磁道 。 另 外 增 
加 一 个 磁道 来 检验 数据 的 奇偶 性 ， 这 样 磁带 共有 9 条 磁道 宽 ， 如 图 7-23 所 示 。 这 种 九 磁 道 的 
磁带 采用 的 是 带 有 奇偶 校 验 的 位 调制 编码 方式 。 奇 偶 校 验 采 用 的 奇 校 验 以 保证 在 传输 一 长 串 零 
(0) 的 过 程 中 至 少 发 生 一 次 磁 通 量 的 “ 反 转 ”变化 ， 这 是 数据 库 的 记录 方式 的 特征 。 


















磁道 0 1 1 1 1 1 T 1 
下 1 Ml 1 1 1 TT 
0 0 0 0 0 0 10000 
0 0Wa0 0 0 0 01110 
磁道 4 1 0 Wl 0 0 00100 
0 1 We O L 0 1 11001 
0 0 0 0 0 0 11010 
人 0 0 0 0 0 0 00110 
磁道 8 0 0 0 0 0 0 00000 
(奇偶 校 验 ) 
EBCDIC 编码 : 人 未 之 问 的 间 隐 全 辣 的 间 队 
ee 记录 之 间 的 间 阶 抉 之 间 的 间 际 
E = 11000101 0 = 11010110 
L = 11010011 R = 11011001 
I 11610011 五 = 1101T001Y 
oO = 11010110 D = 11000100 


[空格 ] = 01000000 
图 7-23 一 个 九 磁道 的 磁带 格式 


在 过 去 的 一 段 时 间 里 ,磁带 技术 的 更 新 是 非常 显著 的 。 许 多 制造 厂商 在 磁带 的 每 一 线性 英 
才 中 不 断 地 加 入 更 多 的 字 节 数 。 更 高 密度 的 磁带 不 仅 对 购买 和 存储 来 说 更 加 经 济 ， 而 且 也 可 以 
使 数据 的 备份 工作 更 加 快捷 。 也 就 是 说 ， 如 果 系 统 在 复制 文件 时 必须 脱 机 ， 则 使 用 高 密度 磁带 
所 造成 的 系统 停机 时 间 就 会 相对 减少 。 如 果 在 写 入 磁带 前 ， 对 数据 进行 压缩 处 理 还 可 以 进一步 
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节约 成 本 (参见 本 章 末 尾 的 相关 部 分 。) 

磁带 的 各 种 革新 技术 所 带 来 的 结果 是 ， 产 生 了 太 多 的 磁带 标准 和 出 现 了 知识 产权 技术 。 各 
种 尺寸 和 容量 的 盒 ( 卡 ) 式 磁带 已 经 取代 了 原来 的 九 磁道 开放 式 的 卷轴 磁带 。 类 似 于 数字 记录 
磁带 上 的 涂 层 已 经 取代 了 原来 的 氧化 物 涂 层 。 现 在 的 磁带 支持 各 种 不 同 的 磁道 密度 ， 并 且 采 用 
蛇 形 或 螺旋 扫描 记录 方法 。 

蛇 形 记录 方法 是 将 数据 位 按照 串 行 
方式 存放 在 磁带 上 。 与 九 磁道 格式 中 字 
节 垂直 于 磁带 边缘 的 存放 方式 不 同 ， 蛇 
形 记录 方法 将 字 节 沿 磁带 长 度 方 向 “ 纵 
向 ” 写 人 ， 每 个 字 都 平行 于 磁带 的 边缘 


1001001101010001001 蔓 一 关 十 村 > 





排列 。 数 据 流 会 沿 着 磁带 的 长 度 方向 写 一 一 一 
入 直到 磁带 的 末端 ， 然 后 将 磁带 反 转 ， 

在 第 一 个 磁道 下 面 的 一 个 磁道 写 人 数据 

(如 图 7-24 所 示 )。 这 种 写 人 过 程 会 一 100100110101000100111101001101000001001001 


100110110100001001100100010110011011000101 


直 持续 下 去 ， 直 到 写 完 磁带 上 的 全 部 磁 。 500111010101001000 " 雪 沪 二 了 全 
道 。 数 字 线 性 磁带 ( DLT) 和 1/4in 盒 式 
WA 图 7-24 “在 蛇 形 磁带 上 三 次 记录 的 通过 方式 
带 上 有 50 条 或 者 更 多 的 磁道 。 

数字 音频 磁带 (DAT) 和 8mm 磁带 
系统 使 用 螺旋 扫描 记录 方法 。 在 其 他 记 
录 系 统 中 ， 磁 带 都 是 以 类 似 于 录音 机 中 
磁带 的 运动 方式 直接 通过 一 个 固定 的 磁 
头 ，DAT 系统 将 磁带 通过 一 个 倾斜 的 旋 
转 鼓 轮 ( 或 称 为 绞盘 )， 鼓 轮 上 分 别 有 
两 个 读 出 头 和 两 个 写 人 头 ， 如 图 7-25 
所 示 。( 在 写 人 过 程 中 ， 当 写 人 完成 后 ， 
读 出 头 便 会 检验 数据 的 完整 性 。) 绞盘 以 
2000rmin 的 速度 旋转 ， 旋 转 方向 与 磁 
带 移动 的 方向 相反 。( 这 种 结构 与 VCR 
上 使 用 的 机 制 很 相似 。) 这 两 个 读 / 写 头 图 7-25 一 种 螺旋 扫描 记录 
的 联动 装置 以 相互 之 间 成 40° 的 方式 写 人 数据 。 由 于 数据 是 通过 两 个 磁头 交 释 写 人 的 ， 所 以 增 
加 了 记录 密度 。 螺 旋 扫 描 系 统一 般 比 较 慢 ， 并 且 磁 带 会 比 采用 简单 磁带 路 径 的 蛇 形 记录 系统 更 








b ) 磁带 上 的 数据 写 入 模式 


线性 磁带 开放 协议 


多 年 来 ， 制 造 商 仔细 保护 着 磁带 驱动 器 的 技术 。 在 同一 个 品牌 磁带 驱动 器 上 制作 的 磁带 无 
法 互相 读 取 。 有 时 甚至 同一 品牌 不 同型 号 的 磁带 驱动 器 都 是 不 兼容 的 。 当 意识 到 这 种 情况 是 很 
不 利 后 。 惠 普 、IBM 和 希捷 科技 于 1997 年 聚集 在 一 起 ， 制 定 了 一 种 名 为 线性 磁带 开放 协议 或 
LTO 的 最 佳 磁带 格式 的 开放 式 规范 。 在 LTO 的 轨道 格式 、 墨 使 设计 、 纠 错 算法 和 压缩 方法 上 
展示 了 供应 商 之 间 的 协作 与 合作 。LTO 的 设计 使 其 可 以 通过 一 系列 的 “版 本 ”进行 细 化 ， 
每 一 代 都 比 之 前 的 版 本 能 力 倍增 。 第 五 代 于 2010 年 发 布 。 这 些 磁带 的 容量 高 达 1.4TB， 在 
无 压缩 的 情况 下 ， 传 输 速率 为 80MB/s。 高 达 2:1 的 压缩 率 是 可 行 的 ， 从 而 使 容量 和 传输 吉 
率 倍增 。 
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LTO 的 可 靠 性 和 可 管理 性 远 远 超过 了 它 之 前 的 所 有 格式 。 深 度 纠 错 算法 可 确保 突 发 错误 以 
及 单位 错误 都 可 恢复 。 磁 带 盒 中 包含 存储 历史 信息 的 存储 器 电路 ， 这 些 信息 包括 磁带 盒 已 使 用 
的 次 数 、 磁 带 的 位 置 和 错误 类 型 、 存 储 在 卷 上 的 数据 的 内 容 表 。 像 DAT 一 样 ，LTO 通过 同时 
读 / 写 操作 来 确保 数据 的 可 读 性 。 若 在 此 过 程 中 发 现 了 错误 则 记录 在 磁带 存储 器 中 ， 同 时 也 记 
录 在 磁带 上 。 然 后 将 数据 重 写 到 磁带 的 一 个 好 段 上 。 赁 借 极 高 的 可 靠 性 、 高 数据 密度 和 传输 速 
率 ，LTO 已 经 获得 了 制造 商 和 买 家 的 广泛 认可 和 支持 。 

磁带 存储 系统 从 一 开始 就 是 大 型 计算 机 使 用 的 主要 产品 。 磁 带 以 便宜 的 价格 提供 了 “无 
限 ” 的 存储 量 。 在 大 型 计算 机 系统 上 磁带 会 继续 成 为 文件 存储 和 系统 备份 的 主要 介质 。 虽 然 磁 
带 本 身 便 宜 ， 但 对 磁盘 进行 目录 编制 和 处 理 的 成 本 代价 可 能 很 高 ， 特 别 是 当 磁 带 库 由 数 千 个 磁 
带 卷 组 成 时 。 考 虑 到 这 个 问题 ， 一 些 供应 商 已 经 生产 出 可 以 在 几 秒 钟 内 对 磁带 进行 编目 、 取 带 
和 装 带 的 自动 机 械 装 置 。 很 多 大 型 数据 中 心 都 使 用 自动 磁带 库 也 称 为 磁带 仓 。 最 大 的 自动 磁带 
库 可 以 有 数 百 TB 的 容量 ， 可 以 在 不 到 半分 钟 的 时 间 内 根据 用 户 的 要 求 加 载 磁 带 盒 。 


磁带 的 未 来 


由 于 磁带 被 认为 是 “ 老 技术 ”， 所 以 有 些 人 认为 磁带 在 当代 计算 机 领域 中 没有 任何 地 位 。 
而 且 ， 由 于 一 些 磁带 的 成 本 超过 了 每 盒 100 美元 ， 所 以 人 们 越 来 越 容 易 地 认为 ， 磁 盘存 储 器 比 
磁带 便宜 (每 兆 字 节 的 美元 数 )。“ 明显 ”的 结论 是 ,使 用 磁盘 到 磁盘 的 备份 而 不 是 磁盘 到 磁带 
的 配置 可 以 节省 大 量 的 资金 。 

事实 上 ， 以 “ 热 ”镜像 形式 的 磁盘 到 磁盘 备份 是 超 高 可 用 性 配置 的 唯一 解决 方案 。 这 样 
的 配置 由 一 组 备份 磁盘 驱动 器 组 成 ， 它 们 与 一 组 相同 的 主 磁 表 集 一 起 更 新 。 镜 像 磁盘 甚至 可 以 
放置 在 距离 主 数据 中 心 几 英里 的 安全 位 置 。 如 果 数 据 中心 受 到 了 和 袭击， 那么 重要 数据 的 副本 将 
会 保存 下 去 。 

完全 依靠 磁盘 到 磁盘 备份 的 最 大 问题 是 对 数据 的 归档 副本 没有 规定 。 磁 带 备 份 通常 遵循 轮 
换 计 划 。 每 个 月 做 的 两 三 组 备份 以 及 每 周 和 每 日 做 的 几 组 备份 将 被 轮换 到 异地 。 每 个 设备 基于 
许多 因素 来 确定 轮换 计划 ， 这 些 因 素 包 括 数据 的 重要 性 、 更 新 数据 的 频率 (波动 性 ，volatility ) 
以 及 将 数据 复制 到 磁带 所 需 的 时 间 。 因 此 ， 最 旧 的 异地 备份 可 能 是 几 个 月 前 拍摄 的 图 像 。 

这 种 “古老 ”的 数据 副本 可 以 从 人 为 的 和 编程 的 错误 中 拯救 数据 库 。 例 如 ， 可 能 只 有 在 
程序 不 正确 运行 之 后 的 数 天 或 数 周 才能 发 现 有 害 的 错误 。 数 据 库 的 镜像 副本 将 包含 与 主要 设备 
相同 的 错误 数据 ， 并 且 在 修复 损坏 方面 没有 任何 帮助 。 如 果 备 份 被 正确 管理 ， 那 么 至 少 有 一 些 
数据 可 以 从 旧 的 备份 磁带 中 恢复 。 

有 些 人 抱怨 把 数据 写 到 磁带 需要 太 长 时 间 ， 没 有 足够 的 时 间 将 事务 活动 停止 以 将 数据 复制 
到 磁带 上 ， 即 备份 窗口 不 足 。 人 们 不 禁 想 到 ， 如 果 备 份 窗口 不 足以 用 于 磁盘 到 磁盘 的 备份 ， 那 
么 也 可 能 不 足以 用 于 磁带 备份 。 然 而 ， 磁 带 驱 动 器 的 传输 速率 与 磁盘 传输 速率 是 具有 竞争 力 
的 ， 若 数据 在 写 入 磁带 时 被 压缩 ， 则 磁带 传输 速率 超过 磁盘 的 速度 。 如 果 备 份 窗口 相对 于 磁盘 
或 磁带 备份 来 说 太 小 ， 那 么 应 该 使 用 镜像 方法 ， 即 使 用 镜像 集 进 行 备份 。 这 称 为 磁盘 到 磁盘 到 
磁带 (D2D2T) 备份 方法 。 

另 一 个 考虑 因素 是 信息 生命 周期 管理 (ILM) ， 其 目的 是 将 存储 介质 的 成 本 与 存储 在 其 中 的 
数据 价值 相 匹配 。 最 重要 的 数据 应 存储 在 最 容易 找到 和 可 靠 的 介质 上 。 美 国 的 “2002 年 萨 班 
斯 -奥克斯 利 法 案 ” 和 “国内 税收 法 ”等 政府 法 规 要 求 长 期 保留 大 量 数据 。 如 果 没 有 引 人 注 
目的 业务 需要 即时 访问 数据 ， 那 么 为 什么 要 保持 在 线 状态 ?ILM 实践 告诉 我 们 ， 在 某 些 时 候 ， 
应 该 加 密 数 据 ， 从 主 存 中 移 除 ， 并 放 在 保管 库 中 。 大 多 数 企 业 的 明智 做 法 是 安装 磁盘 阵列 ， 即 
不 把 价值 10 000 美元 磁盘 阵列 运送 到 异地 进行 无 限 存 储 。 
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由 于 这 些 原 因 ， 在 未 来 许多 年 磁带 将 继续 成 为 归档 选择 使 用 的 介质 。 当 检索 早 就 在 磁盘 存 
储 器 上 被 覆盖 了 的 数据 时 ， 其 成 本 是 非常 合理 的 。 


7.9 RAID 


在 IBM 公司 的 RAMAC 计算 机 发 明 后 的 30 年 里 ， 只 有 一 些 最 大 型 的 计算 机 具有 磁盘 存储 
系统 。 早 期 的 磁盘 驱动 器 非常 昂贵 ， 而 且 与 存储 器 容量 成 比例 地 占用 大 量 的 场地 面积 。 磁 盘 系 
统 需要 一 个 严格 受 控 的 工作 环境 : 太 热 会 破坏 控制 电路 ; 湿度 太 低 可 能 会 引起 静电 累积 而 使 磁 
盘 表 面 磁 通 量 的 极 化 方向 出 现 混乱 。 磁 头 碰撞 或 者 其 他 不 可 修复 的 磁盘 错误 在 商业 、 科 研 和 学 
术 领 域 都 有 可 能 造成 难以 估量 的 损失 。 如 果 在 临近 下 班 时 发 生 磁 头 碰撞 ， 这 就 意味 着 必须 从 上 
次 备份 点 起 (通常 是 昨天 晚上 ) 重 新 开始 输入 今天 所 有 的 数据 。 

很 显然 ， 这 种 情形 是 大 家 都 不 能 接受 的 。 而 且 ， 随 着 人 们 对 电子 数据 存储 设备 的 依赖 程度 
越 来 越 高 ， 这 种 情况 会 变 得 越 来 越 严重 。 长 期 以 来 ， 人 们 一 直 在 寻找 各 种 可 能 的 解决 办 法 ， 归 
根 结 底 ， 磁 盘 还 不 是 非常 可 靠 。 当 然 ， 制 造 更 可 靠 的 磁盘 也 只 是 解决 方法 的 一 部 分 。 

1988 年 ， 美 国 加 州 大 学 伯克利 分 校 的 David Patterson 、Garth Gibson 和 Randy Katz 共同 发 表 
了 一 篇 题 为 “廉价 磁盘 元 余 阵列 的 实例 ”的 论文 ， 在 论文 中 首次 创造 出 了 RAID 一 词 。 在 论文 
中 他 们 介绍 了 如 何 利用 若干 数量 的 “廉价 ”小 磁盘 (例如 微机 使 用 的 磁盘 ) 来 蔡 代 通常 用 在 大 
型 机 上 的 大 型 昂贵 的 单 磁盘 (SLED) 来 提高 大 型 机 磁盘 系统 的 可 靠 性 和 性 能 。 因 为 “廉价 ”一 
词 的 意思 是 相对 的 ， 而 且 可 能 会 被 误导 ， 所 以 这 个 缩写 词 现 在 大 家 普遍 接受 的 意思 是 独立 磁盘 
宛 余 阵列 。 

在 这 篇 论文 中 ，Patterson 、Gibson 和 Katz 定义 了 5 种 类 型 ( 称 为 级 ) 的 RAID， 每 一 级 都 具 
有 不 同 的 性 能 和 可 靠 性 特征 。 原 先 这 些 级 的 编号 是 从 1 ~5， 后 来 大 家 又 定义 了 RAID 的 第 0 级 
和 第 6 级。 当然 ， 各 个 厂商 还 规定 了 其 他 一 些 RAID 级 ， 也 许 这 些 级 在 今后 也 会 成 为 行业 标准 。 
这 些 级 一 般 都 是 被 大 家 普遍 接受 的 RAID 级 的 组 合 形式 。 本 节 将 简单 介绍 7 个 RAID 级 ， 以 及 
几 个 混合 系统 。 这 些 混合 系统 是 为 了 满足 某 些 特殊 性 能 和 可 靠 性 要 求 ， 而 由 几 个 不 同 的 RAID 
级 构成 的 。 

企业 级 存储 系统 的 每 个 供应 商 至 少 提供 了 一 种 类 型 的 RAID 实现 。 但 并 非 所 有 存储 系统 都 
自动 由 RAID 来 保护 。 这 些 系统 通常 被 称 为 磁盘 簇 (JBOD ) 。 


7.9.1 RAID-0 


RAID 级 别 0 或 简称 为 RAID-0， 是 将 数据 块 以 条 带 形式 存放 在 几 个 磁盘 表面 上 ， 这 样 一 个 
记录 就 会 占用 几 个 磁盘 表面 的 多 个 扇 区 ， 如 图 7-26 所 示 。 这 种 方法 也 称 为 磁盘 跨 区 、 块 交错 
数据 分 带 或 磁盘 分 带 。( 分 带 是 简单 地 将 数据 按 逻 辑 顺 序 进行 分 段 ， 以 便 把 各 个 分 段 写 到 多 个 
物理 设备 上 。 这 些 分 段 可 以 小 到 一 位 (如 在 RAID-0 中 ) 或 者 是 某 个 特定 大 小 的 块 。) 

因为 RAID-0 不 提供 完 余 ， 所 以 在 各 种 RAID 配置 结构 中 ，RAID-0 具有 最 佳 性 能 。 特 别 
是 ， 如 果 每 个 磁盘 都 有 自己 独立 的 控制 器 和 高 速 缓存 。RAID-0 非常 便宜 。RAID-0 存在 的 问题 
在 于 系统 的 整体 可 靠 性 仅 为 单个 磁盘 期 望 性 能 的 一 部 分 ( 几 分 之 一 ) 。 例 如 ， 如 果 阵 列 由 5 个 磁 
盘 组 成 ， 并 且 每 个 磁盘 的 设计 寿命 为 50 000h( 大 约 6 年 )， 那 么 整个 系统 的 期 望 设 计 寿 命 为 
50 000/5 = 10 000h( 大 约 14 个 月 ) 。 当 磁盘 数 增加 时 ， 失 效 的 概率 会 随 之 增加 ， 最 后 达到 某 个 
确定 不 变 的 值 。 因 为 没有 宛 余 ， 所 以 RAID-0 没有 容错 能 力 。 因 此 ，RAID-0 所 能 提供 的 唯一 好 
处 是 性 能 。 但 RAID 缺乏 可 靠 性 会 引起 惊慌 。 通 常 ， 推 荐 RAID-0 用 于 一 些 非 关键 的 而 又 要 高 
速 读 取 和 写 入 的 数据 (或 者 是 改变 不 太 频繁 和 经 常 定期 备份 的 数据 ) ， 以 及 用 于 如 视频 、 图 像 
编辑 之 类 的 应 用 程序 中 。 
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图 7-26 使 用 没有 元 余 的 块 交错 数据 分 带 的 RAID-0 来 写 入 一 个 记录 


7.9.2 RAID-1 


RAID 级 别 1 或 者 简称 为 RAID-1( 也 称 为 磁盘 镜像 )， 是 在 所 有 RAID 级 中 具有 最 佳 失效 保 
护 的 一 种 方案 。 在 每 次 写 入 数据 时 ，RAID-1 都 会 将 数据 复制 到 各 为 镜像 盘 的 第 二 组 磁盘 驱动 
器 上 (如 图 7-27 所 示 )。 这 种 安排 提供 了 令 人 满意 的 性 能 ,特别 是 在 镜像 驱动 器 与 主 驱动 器 相 
差 180° 进 行 同步 旋转 时 。 尽 管 写 入 性 能 要 比 RAID-0 慢 ( 因 为 数据 必须 写 两 次 ), 但 是 RAID-1 
的 读 取 速度 更 快 ， 因 为 系统 可 以 从 更 接近 目标 扇 区 的 磁盘 驱动 臂 上 读 取 数据 。 这 样 在 读 取 数据 
时 ， 会 减少 一 半 的 旋转 反应 时 间 。RAID-1 最 适合 面向 事务 的 高 可 用 率 的 工作 环境 ,还 有 其 他 
一 些 需 要 高 容错 率 的 应 用 中 ， 例 如 会 计 或 工资 表 。 





图 7-27 RAID-1 即 磁盘 镜像 


7.9.3 RAID-2 


RAID-1 的 主要 问题 是 成 本 高 : 存储 一 定数 量 的 数据 却 需要 使 用 两 倍 的 磁盘 容量 。 显 然 ， 
更 好 的 方式 是 只 使 用 磁盘 组 中 的 一 个 或 几 个 磁盘 来 存储 其 他 磁盘 中 的 数据 信息 。RAID-2 就 定 
义 了 这 些 方法 中 的 一 种 。 

RAID-2 将 数据 分 带 的 思想 运用 到 了 极致 。RAID-2 在 每 个 条 带 中 只 写 入 一 位 数据 ， 而 不 是 
在 任意 大 小 的 块 中 写 人 数据 ， 如 图 7-28 所 示 。 这 样 至 少 需要 8 个 磁盘 表面 才能 存放 一 个 数据 。 
另外 ， 还 需要 一 组 磁盘 驱动 器 存放 纠 错 信 息 ， 此 纠 错位 是 采用 汉 明 编码 生成 的 。 纠 正 单位 错误 
的 汉 明 编码 所 需要 的 驱动 器 数目 与 需要 保护 的 数据 驱动 器 的 记录 表 数 目 成 正比 。 如 果 磁 盘 阵 列 
中 的 任何 一 个 驱动 器 发 生 故 障 ， 那 么 可 以 使 用 汉 明 编码 字 来 重建 这 个 出 错 的 驱动 器 。 (显然 ， 
汉 明 驱动 器 也 可 以 使 用 数据 驱动 器 来 进行 重建 。) 

因为 每 个 驱动 器 都 只 写 人 一 位 数据 ， 所 以 整个 RAID-2 磁盘 组 就 好 像 是 一 个 大 型 的 数据 磁 
盘 。 所 有 可 用 存储 容量 是 各 个 数据 驱动 器 存储 容量 的 总 和 。 所 有 的 驱动 器 (包括 汉 明 驱动 器 ) 
都 必须 严格 同步 。 和 否则 ， 数 据 会 变 得 混乱 ， 汉 明 驱 动 器 也 就 起 不 到 作用 了 。 因 为 生成 汉 明 码 非 
常 耗 时 ， 所 以 RAID-2 对 大 多 数 商 业 应 用 来 说 速度 太 慢 。 事 实 上 ， 今 天 大 多 数 的 硬盘 驱动 器 都 
有 内 置 的 CRC 纠 错 功能 。RAID-2 方式 在 RAID-1 和 RAID-3 之 间 构 建 了 一 条 理论 桥梁 ， 使 这 两 
种 方式 都 应 用 在 现实 世界 中 。 
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图 7-28 RAID-2， 采 用 汉 明 编码 的 位 交叉 数据 分 带 
7.9.4 RAID-3 


像 RAID-2 一 样 ，RAID-3 是 按照 每 次 一 位 的 方式 将 数据 交错 分 配 到 各 个 数据 驱动 器 条 带 中 
的 。 但是， 与 RAID-2 所 不 同 的 是 ，RAID-3 只 使 用 一 个 驱动 器 来 保存 一 个 简单 的 奇偶 校 验 位 ， 
如 图 7-29 所 示 。 这 种 奇偶 校 验 位 使 用 专门 的 硬件 很 快 就 能 计算 出 来 。 有 具体 方法 是 对 每 个 数据 
位 (用 4b, 表示) 执行 一 个 如 下 所 示 的 异 或 (XOR ) 操作 (对 偶 校 验 ) : 

奇偶 性 = b, XOR b, XOR b, XOR b, XOR b, XOR b, XOR b, XOR b, 
等 价 为 : 
奇偶 性 = (bo + bi +b, +b +b, +b; +bs +b;)mod2 


奇偶 校 验 
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图 7-29 RAID-3: 使 用 奇偶 校 验 磁盘 的 位 交叉 数据 条 带 


可 以 使 用 相同 的 计算 重 构 有 故障 的 驱动 器 。 例 如 ， 假 设 驱 动 器 6 号 失效 并 被 蔡 换 。 其 他 7 
个 数据 驱动 器 和 奇偶 校 验 驱 动 器 上 的 数据 使 用 如 下 : 
bs, = b, XOR b, XOR b, XOR b, XOR b, XOR 0 XOR Parity XOR b, 
RAID-3 要 求 使 用 与 RAID-2 相同 的 数据 复制 方法 和 同步 操作 ， 但 是 RAID-3 比 RAID-1 和 
RAID-2 都 经 济 ， 因 为 它 只 使 用 一 个 驱动 器 进行 数据 保护 。RAID-3 在 一 些 商用 计算 机 系统 上 已 
经 使 用 了 很 多 年 ,但 是 RAID-3 不 太 适 合 应 用 于 面向 事务 的 应 用 程序 。RAID-3 最 适合 需要 读 写 
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大 块 数据 块 的 情况 ， 例 如 图 像 或 视频 处 理 的 应 用 。 
7.9.5 RAID-4 


RAID-4 和 RAID-2 一 样 ， 是 另外 一 个 “理论 上 的 ”RAID 级 。 如 果 将 RAID-4 应 用 于 Patter- 
son 等 人 所 描述 的 情况 中 ，RAID-4 的 性 能 会 很 糟糕 。 像 RDID-3 一 样 ， 一 个 RAID-4 磁盘 阵列 ， 
由 一 组 数据 磁盘 和 一 个 奇偶 校 验 位 磁盘 组 成 。RAID-4 不 是 每 次 写 人 数据 的 一 位 到 各 个 驱动 器 
上 ， 而 是 将 数据 写 人 到 统一 大 小 的 条 带 中 。RAID-4 与 RAID-0 所 描述 的 情况 一 样 ， 会 在 所 有 的 
驱动 器 上 都 创建 条 带 。 通 过 对 数据 条 带 的 位 进行 XOR 操作 可 以 创建 奇偶 校 验 条 带 。 

我 们 可 以 认为 RAID-4 是 带 有 奇偶 校 验 位 的 RAID-0。 但 是 ， 增 加 奇偶 校 验 会 导致 系统 性 能 
严重 下 降 ， 原 因 是 数据 盘 对 奇偶 校 验 盘 的 争 用 。 例 如 ， 假 设 把 数据 写 人 到 跨越 5 个 磁盘 ( 其中， 
4 个 数据 盘 和 一 个 奇偶 校 验 盘 ) 的 条 带 3 中 ， 如 图 7-30 所 示 。 首 先 ， 我 们 必须 读 取 当前 占据 条 
带 3 的 数据 以 及 对 应 的 奇偶 条 带 。 将 原来 的 数据 与 新 数据 执行 XOR 操作 ， 得 出 新 的 奇偶 校 验 。 
然后 写 入 数据 带 ， 同 时 更 新 奇偶 校 验 条 带 。 





Ca 
《EX 
eis 


奇偶 校 验 1-4= ( 条 带 1 ) XOR ( 条 带 2 ) XOR ( 条 带 3 ) XOR ( 条 带 4 ) 
图 7-30 带 一 个 奇偶 校 验 磁盘 的 块 交叉 数据 条 带 的 RAID-4 


设想 一 下 ， 如 果 当 我 们 正在 处 理 奇 偶 校 验 块 时 有 写 人 请 求 在 等 待 ， 例 如 有 一 个 条 带 1 的 写 
入 请 求 和 一 个 条 带 4 的 写 人 请 求 ， 那 么 磁盘 系统 将 发 生 什 么 情况 呢 ? 如 果 正 在 使 用 RAID-0 或 
RAID-1 的 话 ， 那么 这 两 个 等 待 的 请 求 就 可 能 与 写 人 条 带 3 的 操作 并 发 地 执行 。 这 样 ， 奇 偶 校 
验 驱 动 器 就 变 成 了 一 个 瓶颈 ， 从 而 丧失 了 多 磁盘 系统 所 具有 的 所 有 性 能 优势 。 

有 些 人 建议 如 果 将 条 带 大 小 和 要 写 和 的 数据 记录 大 小 进行 优化 处 理 ， 那 么 RAID-4 的 性 能 可 
以 得 到 改善 。 还 有 ， 这 种 方法 对 数据 占用 相同 大 小 记录 的 应 用 程序 (例如 声音 或 视频 处 理 程序 ) 会 
有 好 处 。 然 而 ， 大 多 数 的 数据 库 应 用 都 涉及 变化 范围 很 大 的 记录 ， 因 此 我 们 不 可 能 对 数据 库 中 的 
大 量 记 录 找 到 一 个 “最 佳 ”的 长 度 。 因 为 RAID-4 的 性 能 很 差 ， 所 以 在 商业 上 它 并 没有 得 到 应 用 。 








7.9.6 RAID-5 


大 多 数 人 都 认为 RAID-4 可 以 对 单一 磁盘 出 错 的 情况 提供 足够 的 保护 。 但 是 ， 由 于 奇偶 校 
验 盘 所 导致 的 瓶颈 问题 ， 使 得 RAID-4 不 适合 应 用 在 需要 高 事务 吞吐 量 的 环境 中 。 可 以 肯定 地 
说 ， 如 果 考 虑 某 种 类 型 的 负载 平衡 ,将 奇偶 校 验 位 写 到 多 个 磁盘 而 不 只 是 一 个 磁盘 上 ， 那 么 否 
吐 量 问题 无 疑 会 得 到 改善 。 这 也 正 是 RAID-5 要 做 的 事情 。RAID-5 是 RAID-4 将 奇偶 校 验 盘 分 
散 到 整个 磁盘 阵列 中 的 情形 ， 如 图 7-31 所 示 。 

因为 一 些 请 求 能 被 并 发 地 服务 ， 所 以 RAID-5 在 所 有 的 奇偶 校 验 模型 中 提供 了 最 佳 的 读 操 
作 吞 吐 量 ， 并 且 在 写 操 作 时 也 具有 令 人 满意 的 吞吐 量 。 如 图 7-31 所 示 ， 磁 盘 阵列 可 以 同时 服 
务 对 磁盘 4 第 6 条 带 和 对 磁盘 1 第 7 条 带 的 写 和 请求 ， 因 为 这 些 服务 请 求 无 论 是 奇偶 校 验 还 是 
数据 操作 都 分 别 使 用 不 同 的 磁盘 驱动 臂 组。 然而 在 所 有 RAID 级 中 ，RAID-5 需要 的 磁盘 控制 器 
是 最 复杂 的 。 








图 7-31 带 分 布 式 奇偶 校 验 的 块 交叉 数据 条 带 的 RAID-5 


与 其 他 RAID 系统 相 比 ，RAID-5 能 够 以 最 小 的 成 本 提供 最 佳 的 保护 。 正 因为 如 此 ，RAID- 
5 已 经 非常 成 功 地 应 用 在 商业 上 。 在 所 有 以 RAID 为 基础 的 应 用 系统 中 ，RAID-5 安装 的 数量 是 
最 大 的 。RAID-5 的 主要 应 用 包括 : 文件 和 应 用 程序 服务 器 、 邮 件 和 新 闻 服 务 器 、 数 据 库 服务 
器 和 网 络 服务 器 等 。 


7.9.7 RAID-6 


前 面 讨论 的 大 多 数 RAID 系统 一 次 最 多 只 能 允许 有 一 个 磁盘 出 错 。 问 题 是 大 型 计算 机 系统 
的 磁盘 驱动 器 常常 有 成 群 成 簇 失效 的 倾向 。 发 生 这 种 情况 一 般 有 两 个 原因 ， 第 一 ， 几 乎 同一 时 
间 生 产 的 磁盘 会 在 相同 的 时 间 到 达 它 们 的 预期 使 用 寿命 。 所 以 ， 如 果 被 告知 新 磁盘 组 的 使 用 寿 
命 大 约 是 6 年， 那么 可 以 预计 第 六 年 磁盘 系统 就 会 有 问题 ,或 许 会 出 现 多 个 磁盘 同时 失效 的 
情况 。 

第 二 ， 磁 盘 驱动 器 的 损坏 通常 是 由 某 些 灾难 性 事件 引起 的 ， 比 如 电源 波动 。 电 源 波 动 可 能 
会 在 同一 时 刻 毁 坏 所 有 的 磁盘 驱动 器 。 最 不 耐用 的 磁盘 最 先 损坏 ， 接 着 是 第 二 个 不 耐用 的 磁 
盘 ， 如 此 持续 下 去 。 类 似 这 种 连续 的 磁盘 损毁 可 能 会 延续 几 天 甚至 几 周 。 如 果 这 些 持续 性 损坏 
辜 巧 在 磁盘 的 平均 修复 时 间 (MTTR ) (包括 打 电 话 和 修复 人 员 到 达 所 需 时 间 ) 内 发 生 ， 那 么 在 还 
没有 替换 第 一 个 损坏 磁盘 之 前 第 二 个 磁盘 也 可 能 损毁 了 ， 因 而 整个 磁盘 阵列 会 变 得 无 法 继续 使 
用 和 服务 。 

对 于 需要 高 可 用 性 的 系统 必须 能 够 允许 多 个 磁盘 同时 失效 的 情况 发 生 ， 特 别 是 在 MTTR 可 
能 会 是 一 个 很 大 数字 的 情况 下 。 如 果 将 磁盘 阵列 设计 为 可 以 承受 两 个 磁盘 驱动 器 并 发 失效 ， 那 
么 就 可 以 有 效 地 把 MTTR 的 数字 扩大 一 倍 。 事 实 上 ，RAID-1 磁盘 系统 就 具有 这 种 生存 能 力 。 
只 要 某 个 磁盘 及 其 镜像 盘 不 在 同一 时 刻 失效 ,那么 RAID-1 磁盘 阵列 就 可 以 在 失去 一 半 磁 盘 后 
还 能 够 使 用 。 

RAID-6 提供 了 解决 这 种 多 个 磁盘 失效 问题 的 一 种 经 济 实用 的 方案 。 为 此 ，RAID-6 对 每 排 
(或 者 每 个 水 平行 ) 驱 动 器 使 用 了 两 组 纠 错 条 带 。 除 了 采用 奇偶 校 验 外 ，RA1D-6 还 使 用 里 德 - 
所 罗 门 纠 错 编码 来 增加 第 二 层 保 护 。 为 每 个 数据 条 带 配置 两 个 检 错 条 带 会 增加 存储 器 的 成 本 。 
如 果 没 有 保护 的 数据 存储 在 个 磁盘 上 , 那么 RAID-6 增加 的 这 种 保护 就 需要 使 用 N+2 个 磁 
盘 。 因 为 需要 写 入 两 类 奇偶 校 验 ， 所 以 RAID 6 所 提供 的 写 人 性 能 相当 差 。RAID-6 的 一 种 配置 
结构 如 图 7-32 所 示 。 

直到 最 近 ， 还 没有 用 于 商用 的 RAID-6 系统 。 产 生 这 种 情况 有 两 种 原因 。 第 一 ， 生 成 里 德 - 
所 罗 门 编码 需要 相当 大 的 代价 。 第 二 ， 更 新 磁盘 上 的 纠 错 编码 要 求 有 双 倍 的 读 / 写 操作 。IBM 公 
司 是 第 一 个 利用 RAMAC RVA 2 Turbo 磁盘 阵列 将 RAID-6 带 到 了 市 场 上 的 。RVA 2 Turbo 磁盘 阵 
列 将 磁盘 条 带 的 运行 “日 志 ” 存 放 在 磁盘 控制 器 的 高 速 缓存 中 ， 以 消除 RAID-6 的 写 入 损失 。 日 
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志 数 据 允 许 磁盘 阵列 每 次 处 理 一 个 数据 条 带 ， 并 且 在 数据 写 人 磁盘 前 为 整个 条 带 计算 全 部 的 奇偶 
校 验 位 和 纠 错 编 码 。 在 这 里 ， 系 统 决 不 会 将 数据 重新 写 人 到 更 新 前 数据 所 占据 的 那个 条 带 中 。 相 
反 , 一 旦 这 个 更 新 条 带 已 经 在 其 他 位 置 写 入 ， 那么 这 个 先前 被 占用 的 条 带 就 会 标记 为 空闲 空间 。 





: 





P= 奇偶 校 验 
Q= 里 德 -所 罗 门 码 


图 7-32 有 双重 出 错 保护 的 块 交 叉 数据 条 带 的 RAID-6 


7.9.8 RAID DP 


一 种 相对 较 新 的 RAID 技术 采用 一 对 奇偶 校 验 块 ， 这 对 校 验 块 保护 数据 块 的 重 琶 组 。 该 方 
法 根据 驱动 器 制造 商 的 不 同名 称 ( 实现 之 间 存 在 细微 差异 ) 来 命名 。 在 本 文中 用 得 最 多 的 名 字 
是 双重 奇偶 RAID( RAID DP) 。 在 文献 中 出 现 的 还 有 EVENODD 、 对 角 线 奇偶 校 验 RAID( 也 叫 
RAID DP) 、RAID 5DP 和 高 级 数据 保护 RAID( RAID ADG ) 等 。 

一 般 的 想法 是 任何 单 盘 数据 块 都 由 两 个 线性 独立 的 奇偶 校 验 功能 所 保护 。 像 RAID-6 一 样 ， 
RAID DP 可 以 容忍 两 个 磁盘 驱动 器 同时 发 生 故 障 ， 而 不 会 丢失 数据 。 在 图 7-33 所 示 的 原理 图 
中 ， 观 察 可 知 在 盘 Pl 上 每 个 RAID 曲面 中 的 内 容 是 其 左 侧 所 有 水 平面 的 函数 。 例 如 ，AP1 是 
Al 、A2、A3 和 A4 的 函数 。P2 的 内 容 是 表面 的 对 角 图 案 功 能 。 例 如 ，BP2 是 A2、B3 、C4 和 
DP1 的 函数 。 请 注意 ，AP1 和 BP2 在 A2 上 重 羡 。 这 种 重 盖 可 以 通过 迭代 地 恢复 重 有 的 表面 来 
重 构 任 何 两 个 驱动 器 。 此 过 程 如 图 7-34 所 示 。 





AP1 = R1 申 RAR2 ®@ A3@A4 AP2 = A1@B2@®@C3@®@D4 
BP1 = Bl@B2®@B3@®B4 BP2 = A2@®@B3@C4 申 DP1 


CPl1 = Cl@C2@C3@cCA CP2 A3®@B4 © CP1 ©® D1 
= DI®D2®@D3®D4 DP2 = A4®@BPI1®@Cl1® D2 


图 7-33 ”RAID DP 的 错误 恢复 模式 
来 源 : A2 的 恢复 由 方程 AP1 和 BP2 的 重 司 提供 
由 于 具有 双重 奇偶 校 验 功能 ， 因 此 RAID DP 可 以 在 包含 更 多 物理 磁盘 的 阵列 上 使 用 ， 而 不 仅 
是 使 用 RAID 5 的 简单 奇偶 校 验 来 可 靠 地 保护 。 根 据 制造 商 的 选择 ， 数 据 可 以 是 条 带 或 块 的 。 简 
单 的 奇偶 校 验 功能 比 RAID-6 的 里 德 - 所 罗 门 码 校正 提供 了 更 好 的 性 能 。 然 而 ， 由 于 需要 双重 读 
写 ， 所 以 RAID DP 的 写 入 性 能 从 RAID 5 开始 有 所 降低 ， 但 是 好 处 是 可 靠 性 却 有 了 很 大 提升 。 








a) 发 生 灾难 性 的 事故. 两 个 驱动 器 都 受 影响 ， 它 们 都 要 更 换 


ee 


= B3@c4 @ DP1@ BP2 
b ) We 等 式 恢复 磁盘 片 A2 








Al = A2® A3® A4@ 田 AP1 
c ) 使 用 这 个 等 式 恢复 盘 片 Al 





加 本 六 


B2 = Al@C3@®@ D4® AP2 
d ) 使 用 这 个 等 式 恢复 盘 片 B2 
3 4 


= 





Bl = B2®@ B3® B4@® BP1 
e ) 使 用 这 个 等 式 恢复 盘 片 Bl 


图 7-34 使 用 RAID DP 恢复 两 台 撞 损 的 磁盘 组 
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7.9.9 混合 RAID 系统 


许多 大 型 的 计算 机 系统 并 不 局 限于 只 使 用 一 种 类 型 的 RAID。 在 某 些 情况 下 ,平衡 磁盘 系 
统 的 高 可 用 性 和 经 济 性 是 非常 重要 的 。 例 如 ,我 们 可 能 希望 使 用 RAID-1 来 保护 包含 操作 系统 
文件 的 驱动 器 ， 而 对 于 数据 文件 使 用 RAID-5 就 足够 了 。RAID-0 非常 适合 存放 在 长 时 间 运 行 过 
程 中 的 “临时 ”文件 ， 并 且 RAID-0 较 快 的 磁盘 访问 速度 可 以 有 效 地 减少 程序 执行 的 时 间 。 

有 时 ， 可 以 使 用 多 个 RAID 组 合 起 来 构建 一 种 “新 型 ”的 RAID。 如 图 7-35a 所 示 ，RAID- 
10 就 是 这 样 一 种 磁盘 系统 ， 它 组 合 了 RAID-0 的 分 带 方式 和 RAID-1 的 镜像 功能 。 虽 然 代 价 非 
常 昂贵 ， 但 是 RAID-10 可 以 提供 优良 的 读 取 性 能 和 最 佳 的 可 用 性 。 另 一 个 混合 级 是 用 于 共享 和 
复制 数据 的 RAID 0 + 1 或 RAID 01( 不 要 与 RAID 1 混淆 )。 与 RAID 10 一 样 ， 它 也 结合 了 镜像 
和 条 带 化 ， 但 配置 相反 ， 如 图 7-35b 所 示 。RAID 01 允许 磁盘 阵列 在 同一 个 镜像 集中 多 个 驱动 
器 发 生 故障 时 继续 运行 ， 并 显著 提高 了 读 写 性 能 。 如 图 7-36 所 示 ，RAID 50 是 条 带 化 和 分 布 式 
奇偶 校 验 的 组 合 。 在 需要 具有 高 容量 良好 容错 能 力 时 这 种 RAID 配置 是 很 好 的 。RAID 级 几乎 
可 以 在 任何 配置 中 组 合 ; 尽管 租 套 通常 限于 两 个 级 别 ， 但 是 正在 探索 三 舱 套 RAID 配置 以 成 为 
可 行 的 候选 方案 。 
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RAID 1 





b ) 带 有 条 带 镜 像 的 RAID01 
图 7-35 混合 RAID 级 别 
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图 7-36 带 有 条 带 和 奇偶 校 验 的 RAID 50 
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在 阅读 了 前 面 几 节 的 内 容 后 ， 我 们 应 该 很 清楚 ， 编 号 较 高 的 RAID 级 不 一 定 是 “更 好 ”的 
RAID 系统 。 无 论 如 何 ， 还 是 有 许多 人 会 很 自然 地 认为 具有 更 高 编号 的 系统 通常 表示 要 上 比 编号 
低 的 系统 更 好 一 些 。 由 于 这 个 原因 ，RAID 咨询 委员 会 的 行业 协会 最 近 已 经 在 组 织 和 重新 命名 
上 述 的 RAID 系统 。 本 书 选 择 保留 了 “Berkeley” 的 命名 方法 ， 因 为 这 种 命名 方法 得 到 了 更 加 
广泛 的 认同 。 表 7-1 总 结 了 刚刚 描述 的 RAID 级 别 。 


表 7-1 RAID 性 能 总 结 

























































































全 

0 块 交 叉 数据 条 带 化 ns 非常 好 成 本 最 低 ， 无 保护 
在 第 二 个 相同 的 集合 中 数据 | 。 人 天 读 取 时 比 单 磁盘 好 , 写 | ”保护 性 优秀 ， 成 

镜像 入 时 比 它 关 

使 用 汉 明码 进行 位 交叉 数据 | 。 ee 性 能 好 ， 成 本 高 ， 
2 | 条 带 和 实际 不 能 使 用 

使 用 奇偶 校 验 磁 盘 进行 位 交 
| 好 非常 好 性 能 好 ， 成 本 合理 
使 用 一 个 奇偶 校 验 夏 盘 进 行 | xp 在 写 人 时 与 单个 磁盘 同 | ”成 本 合理 ， 性 能 

块 交错 数据 条 带 样 精 糕 ， 读 取 非 常 好 差 ， 实 际 上 不 能 使 用 

用 分 布 式 奇偶 校 验 磁 盘 进行 | 写 入 不 如 单 磁盘 ， 读 取 ee 
a 非常 好 Ne 性 能 好 ， 成 本 合理 
， 有 双重 纠 错 保护 的 块 交错 数 | 。 人 天 写 比 单 磁盘 更 粳 糕 , 读 | ”性 能 好 ， 成 本 合 

据 条 带 取 非 常 好 理 ， 实 现 复杂 

| 读 取 时 比 单个 磁盘 要 好 ，| 。” 性 能 好 ， 成 本 高 ， 
到 镜像 磁盘 条 带 优秀 写 入 时 不 如 单个 磁盘 保护 性 优秀 
| 良好 的 读 性 能 。 比 RAID | ”性 能 好 ， 成 本 高， 

9 奇偶 条 带 优秀 5 好 ,不 如 RAID 10 好 保护 性 好 
册 使 用 双 奇 偶 校 验 磁盘 的 块 交 读 取 时 比 单个 磁盘 要 好 , | ” 性 能 好 ， 成 本 合 

又 数据 条 带 写 入 时 不 如 单个 磁盘 理 ， 保 护 性 优秀 











7. 10 ”数据 存储 的 未 来 


没有 人 大 胆 地 预测 过 类 似 摩尔 定律 的 磁盘 存储 的 发 展 趋势 。 事 实 恰恰 相反 : 多 年 来 ， 专 家 
已 经 定期 发 布 了 磁盘 存储 的 限制 ， 只 有 当 制 造 商 宣布 有 超出 最 新 “理论 存储 限制 ”的 产品 时 ， 
才 会 将 预测 打破 。20 世纪 70 年代， 磁盘 存储 的 密度 限制 为 大 约 是 2MB/in 。 今 天 的 磁盘 通常 
支持 超过 20GB/in 的 存储 密度 。 因 此 ,“ 不 可 能 ”已 经 实现 了 万 次 。 这 些 增益 已 经 通过 一 些 科 
学 技术 的 改进 (诸如 磁性 材料 科学 ， 磁 光 记 录 头 以 及 更 有 效 的 纠 错 码 的 发 明 ) 而 得 以 实现 。 但 
是 随 着 数据 密度 的 增加 ， 在 每 个 位 单元 的 边界 内 已 没有 更 多 的 磁性 颗粒 可 用 。 当 磁盘 的 热 属性 
导致 编码 的 磁性 颗粒 自发 改变 极 性 ,使 1 变 为 0 或 0 变 为 1 时， 就 达到 了 最 小 的 可 能 位 单元 面 
积 。 这 种 行为 称 为 超 顺 磁性 ， 发 生 这 种 情况 的 位 密度 称 为 超 顺 磁极 限 。 在 本 文中 ， 超 顺 磁 极限 
在 150 ~200GB/in 之 间 。 即 使 这 个 数字 有 几 个 数量 级 的 误差 ， 磁 性 数据 密度 的 增长 也 可 能 已 经 
达到 要 求 了 。 未 来 肯定 会 实现 使 用 全 新 存储 技术 的 数据 密度 的 增长 。 出 于 这 种 考虑 ， 当 前 的 研 
究 旨 在 使 用 生物 、 全 息 或 机 械 来 蔡 代 磁盘 。 

生物 材料 可 以 用 许多 不 同 的 方式 存储 数据 。 当 然 ， 最 终 的 数据 存储 是 在 DNA 中 发 现 的 ， 
其 中 数 万 亿 个 不 同 的 信息 可 以 编码 在 一 小 段 遗传 物质 中 。 但 创建 一 个 实用 的 DNA 存储 设备 需 
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要 几 十 年 。 比 较 可 行 的 方法 是 将 无 机 磁性 材料 (如 铁 ) 与 生物 材料 (如 油 或 蛋白 质 ) 结合 起 来 
成 功 的 原型 鼓励 人 们 期 待 生物 材料 能 够 支持 1Tbyi 的 数据 密度 。 大 规模 生物 储存 装置 可 能 在 
21 世纪 的 二 三 十 年 内 投放 市 场 。 

全 息 图 是 通过 操纵 激光 束 呈 现 的 三 维 图 像 。 信 用 卡 和 一 些 受 版 权 保护 的 CD 和 DVD 使 用 彩 
虹 色 全 息 图 印刷 ， 以 防 假冒 。 至 少 最 近 50 年 来 ,全 息 数据 存储 的 概念 点 燃 了 小 说 作家 和 计算 
机 研究 人 员 的 想象 力 。 由 于 聚合 物 科技 的 进步 ， 全 息 存 储 终于 准备 从 纸浆 杂志 页 面 跳 入 数据 中 
i js 

在 全 息 数 据 存储 中 ， 激 光束 被 分 成 ”激光 光束 分 离 器 
两 个 单独 的 光束 ， 一 个 是 物体 光束 ; 另 中 作 S 
-个 是 参考 光束 ， 如 图 7-37 所 示 。 物 体 
光束 通过 调制 器 产生 编码 数据 模式 。 调 
制 的 物体 光束 与 参考 光束 相交 ， 以 在 聚 
合 物 记 录 介 质 中 产生 干涉 图 案 。 当 介质 
参考 光束 照射 时 ， 可 从 中 恢复 数据 ， 从 光学 中 继 器 考 光 
而 再 现 原始 编码 的 物体 光束 。 

全 息 数 据 存储 有 许多 原因 令 人 兴 
奋 。 最 重要 的 是 它 通过 使 用 三 维 介质 可 
以 实现 巨大 的 数据 密度 。 初 始 实验 系统 
提供 的 数据 密度 超过 30GB/in  ， 传 输 速 
率 约 为 1CB/s。 全 息 数据 存储 在 提供 内 






聚合 物 


物体 光束 记录 介质 





容 可 寻 址 的 大 容量 存储 能 力 方面 也 是 独 A 
一 无 二 的 。 这 意味 着 全 息 存储 就 像 我 们 We 


使 用 磁盘 一 样 ， 不 一 定 需要 目录 系统 。 图 7-37 全 息 存 储 
所 有 访问 都 将 直接 转 到 文件 的 放置 位 置 ， 
无 须 先 查询 任何 文件 分 配 表 。 
将 全 息 数据 存储 引入 商业 化 生产 的 
最 大 挑战 就 是 创建 合适 的 聚合 物 介质 。 虽 
然 取 得 了 很 大 进展 ,但 获得 廉价 、 可 重 
写 、 稳 定 的 介质 似乎 还 需要 几 年 的 时 间 。 
微 电 子 机 械 系 统 ( MEMS ) 设 备 提供 了 
超越 磁 存 储 极 限 的 另 一 种 方法 。IBM 的 
Millipede 就 是 这 样 一 个 设备 。Millipede 由 
数 千 个 微观 悬臂 组 成 ， 这 些 悬 臂 通过 将 加 
热 的 微观 尖端 压 人 聚合 物 基底 来 记录 二 进 HA 
制 1。 当 尖端 读 到 聚合 物 中 的 印记 时 ， 便 
认为 读 取 了 二 进 制 1。 实 验 室 原型 已 经 实 ”图 7-38 IBM Millipede 存储 设备 的 三 端 集成 扫描 电子 显 
现 了 大 于 100GB/in? 的 密度 ， 随 着 技术 的 微 镜 图 像 。 悬 臂 的 长 为 70km 和 宽 为 77um。 旦 
a ee 辟 的 外 辟 只 有 10pm 宽 。 
改进 ， 预 计 可 达 1Th/in 。 i 基 袁 来 源 : 由 IBM 公司 提供 @@2006 国际 商业 机 器 公司 
的 电子 显微镜 照片 如 图 7-38 所 示 。 
即使 使 用 传统 的 磁盘 ， 企 业 级 存储 的 规模 和 复杂 性 也 在 不 断 增长 。TB 大 小 的 存储 系统 现 
在 是 很 常见 的 。 未 来 的 存储 问题 越 来 越 有 可 能 不 是 没有 足够 的 容量 ， 而 是 在 数据 存储 之 后 怎样 
找到 有 用 的 信息 。 这 个 问题 可 能 会 被 证 明 是 最 棘手 的 
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碳 纳米 管 (CNT) 是 纳米 技术 领域 最 近 的 许多 发 现 之 一 。 顾 名 思 义 ， 碳 纳米 管 是 圆柱 形 的 碳 
原子 ， 其 中 圆柱 体 的 壁 是 一 个 原子 厚 。 碳 纳米 管 可 以 像 开 关 一 样 打开 和 关闭 以 存储 二 进 制 的 一 
位 。 科 学 家 设计 了 许多 不 同 的 纳米 管 存 储 上 需 配置 。 图 7-39 是 Nantero 公司 在 其 NRAM 产品 中 使 
用 的 配置 示意 图 。 纳 米 管 悬挂 在 一 个 称 为 栅 极 的 导体 上 ( 见 图 7-39a) ， 这 表示 零 状 态 。 为 了 将 
顶 极 置 位 为 1， 栅 极 上 应 施加 足够 大 的 电压 以 吸引 纳米 管 ( 见 图 7-39b) 。 管 保持 在 适当 的 位 置 ， 
直到 施加 了 释放 电压 。 因 此 ， 位 元 在 读 取 或 写 人 之 前 完全 不 消耗 功率 。 


因为 测量 的 访问 时 间 在 3ns 左右 ， 所 ” 源 极 D A 县 
以 碳 纳米 管 已 经 成 为 易 失 性 RAM 的 非 易 。 Sjeeessasesosseseseas[D [S| a 
失 性 替代 品 ， 并 可 替代 闪存 。 尽 管 在 编写 ET 


本 书 时 尚未 批量 生产 ， 但 碳 纳 米 管 存储 器 
的 可 制造 性 已 被 证 明 。 很 容易 看 出 ， 如 果 
可 以 经 济 地 制造 大 容量 碳 纳米 管 存储 器 ， 图 7-39 碳 纳米 管 的 位 存储 器 
则 除了 在 大 型 计算 机 系统 中 至 少 需要 一 级 高 速 缓存 之 外 ， 它 将 可 以 有 效 地 平坦 化 存储 层次 
结构 。 

像 碳 纳 米 管 一 样 ， 忆 阻 存储 器 是 一 种 非 易 失 性 RAM。 忆 阻 器 是 一 种 最 近 发 现 的 电子 组 件 ， 
它 将 电阻 器 的 特性 与 存储 器 相 结合 。 也 就 是 说 ， 可 以 控制 组 件 对 电流 的 阻力 ， 使 得 “高 ”和 
“ 低 ” 状 态 可 以 有 效 地 存储 数据 位 。 这 些 高 电阻 和 低 电阻 的 状态 通过 施加 的 某 些 阔 值 电流 来 控 
制 ， 这 些 电流 可 以 改变 下 面 半导体 材料 的 物理 性 质 。 像 碳 纳米 管 一 样 ， 忆 阻 存储 器 也 可 以 取代 
闪存 并 使 存储 层次 结构 平坦 化 。 但 只 有 可 以 经 济 地 制造 大 容量 设备 ， 才 能 实现 这 一 目标 。 

一 些 公司 和 政府 正在 投入 大 量 的 研究 资金 ， 将 新 的 存储 技术 推 向 市 场 。 我 们 对 数据 ， 尤 其 是 
可 访问 数据 的 渴望 似乎 没有 结束 ， 我 们 可 以 从 所 谓 的 大 数据 中 推断 出 人 类 行为 的 各 种 趋势 和 预 
测 。 然 而 ， 大 数据 变 得 日 益 昂贵 ， 因 为 每 天 24 小 时 的 磁盘 存储 需要 很 多 磁盘 ， 在 此 过 程 中 消耗 了 
千 兆 瓦 的 电能 。 拥 有 数 十 亿美 元 的 投资 资金 流入 这 些 新 技术 ， 预 期 收益 将 会 增加 几 个 数量 级 。 


本 章 小 结 

本 章 比 较 全 面 地 评述 了 有 关 计 算 机 输入 /输出 和 存储 系统 的 诸多 方面 内 容 。 你 可 以 了 解 到 不 同类 型 的 
机 器 需要 使 用 不 同 的 IO 结构 。 从 本 质 上 来 说 ， 在 大 型 计算 机 系统 中 存储 和 访问 数据 的 方式 与 小 型 计算 
机 土 所 使 用 的 方法 是 完全 不 同 的 。 对 于 最 小 的 计算 机 (如 嵌入 式 处 理 器 ) ， 程 序 控制 VO 最 为 合适 ， 因 为 
它 比 较 灵 活 ， 但 在 通用 系统 中 不 能 提供 良好 的 性 能 。 对 于 单 用 户 系 统 ， 中 断 驱 动 VO 是 最 佳 选 择 ， 特 别 
是 涉及 多 任务 时 。 单 用 户 和 中 型 系统 通常 采用 DMA 控制 LO， 其 中 CPU 将 IO 功能 分 配给 了 DMA 电路 。 
通道 VO 最 适用 于 高 性 能 系统 。 它 分 配 单独 的 大 容量 路 径 以 保证 大 量 数据 的 传输 。 

LO 可 以 按 字符 或 块 进行 处 理 。 字 符 VO 最 适合 用 于 串 行 数据 传输 。 块 VO 可 用 于 串 行 或 并 行 数据 传 
输 。 描 述 IBM RAMAC 系统 的 原始 文章 可 以 在 Lesser & Haanstra( 2000) 和 Noyes & Dickinson(2000 ) 中 找到 。 

本 章 还 介绍 了 数据 如 何 存储 在 各 种 介质 上 ， 包 括 磁带 、 磁 盘 和 光学 介质 。 如 果 你 能 够 在 编程 、 系 统 
设计 或 问题 诊断 的 上 下 文中 分 析 磁 盘 性 能 ， 那 么 对 磁盘 操作 的 理解 就 变 得 很 有 用 了 。 

本 章 中 有 关 RAID 系统 的 讨论 将 有 助 于 我 们 理解 RAID 是 如 何 改进 系统 性 能 和 增加 系统 可 用 性 的 。 
表 7-1 中 给 出 了 最 重要 的 RAID 实现 。 

希望 通过 这 些 内 容 的 讨论 ， 你 可 以 在 做 出 任何 实际 的 系统 决定 前 ， 对 系统 的 性 能 有 一 个 综合 评价 。 
可 以 看 到 ， 我 们 常常 需要 考虑 如 何在 “更 好 ”与 “更 快 ” 之 间 ， 以 及 “更 快 ” 与 “更 便宜 ”之 间 做 出 
适当 的 选择 。 如 果 作 为 系统 项 目 负 责 人 ， 我 们 必须 确信 我 们 的 客户 也 能 够 和 我 们 一 样 理解 这 种 性 能 之 间 
的 权衡 关系 。 通 常 ， 我 们 需要 非常 有 策略 地 使 客户 完全 相信 世界 上 没有 免费 的 午餐 。 


扩展 阅读 
阅读 Amdahl( 1967 ) 的 原始 文献 可 以 对 阿 姆 达尔 定律 有 更 多 的 了 解 。Hennesey 和 Patterson(2011 ) 提 


a) 置 为 0 b) 置 为 1 
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供 了 更 多 的 有 关 对 阿 姆 达尔 定律 的 适用 范围 。Gustavson( 1984 ) 的 著作 关于 计算 机 总 线 的 部 分 非常 值得 
阅读 。 

Rosch( 1997 ) 的 著作 中 包含 大 量 与 本 章 主题 相关 的 细节 内 容 , 但 是 这 本 书 主 要 侧重 的 是 小 型 计算 机 系 
统 。 这 本 书 的 内 容 组 织 得 很 好 ， 而 且 写 作风 格 清楚 易 读 。Anderson( 2003 ) 的 文章 对 相关 内 容 的 讨论 略 有 
不 同 。 

Rosch(1997) 的 著作 还 为 CD 存储 技术 进行 了 一 个 很 好 的 概述 。 包括 CD- ROM 的 物理 基础 、 数 学 背景 
和 电子 工程 方面 的 支撑 等 更 完整 的 介绍 ， 可 以 阅读 Stan(1998) 和 Williams( 1994) 的 著作 。 

Patterson 、Gibson 和 Katz( 1988 ) 的 论文 是 有 关 RAID 结构 的 基础 性 文章 。Blaum 等 (1994) 和 Corbett 等 
(2004 ) 的 论文 中 也 很 好 地 介绍 了 RAID DP。 

到 目前 为 止 ，IBM 公司 设立 的 众多 网 站 是 提供 有 关 详 细 技术 信息 的 最 好 网 站 。IBM 公司 独自 在 网 络 
上 提供 了 大 量 的 优秀 文献 以 方便 搜索 。IBM 公司 的 主页 是 : www. ibm. com。 除 了 其 服务 器 产品 热线 
(www. ibm com/eservers) 外 ，IBM 公司 还 设 有 许多 特殊 兴趣 领域 的 专门 网 站 ,包括 有 关 存储 系统 的 网 站 
(www. storage. ibm. com) 。IBM 公司 的 研发 网 页 ( www. research. ibm. com ) 包含 大 量 与 新 技术 发 展 相关 的 最 
新 信息 。 高 质量 的 学 术 期 刊 可 以 通过 www. research. ibm. com/journal 查找 。jJaquette 关于 LTO 的 文章 
(2003 ) 中 有 相关 介绍 。 

多 年 来 已 经 对 全 息 存 储 进 行 了 不 同 程度 的 讨论 。 最 近 的 两 篇 文章 是 Ashley 等 人 (2000) 和 Orlov 
(2000) 。 访 问 IBM 苏黎世 研究 实验 室 网 站 (www. zurich. ibm. com/st) 的 访问 者 将 获得 有 关 MEMS 存储 系统 
的 迷人 照片 和 详细 描述 。Carley 、Ganger&Nagle( 2000 ) 和 Vettiger( 2000 ) 的 文章 是 两 篇 关于 同一 主题 的 好 
文章 。 

Michael Cornwell(2012 ) 关于 固态 便 盘 的 文章 为 读者 提供 了 一 些 很 好 的 概括 信息 。 各 个 制造 商 的 网 站 
都 上 传 了 有 关 这 些 设备 的 技术 文档 。SanDisk (http: 和 www. sandisk. com ) 、Jntel( http: 和 www. intel. com ) 和 
Hewlett-Packard( http: 和 www. hp. com/ ) 就 是 3 个 这 样 的 网 站 。 

Kryder 和 Kim(2009 ) 的 文章 是 对 本 章 讨论 的 以 及 一 些 没有 讨论 的 有 趣 的 存储 技术 的 期 待 。 有 关 忆 阻 
存储 器 的 更 多 信息 可 以 在 Anthes(2011) 和 Ohta(2011 ) 的 论文 中 找到 。 您 可 以 在 Bichoutskaia 等 人 (2008) 、 
Zhou 等 人 (2007) 和 Paulson(2004) 的 论文 中 探索 CNT 的 尺 人 世界 。 可 以 保持 关注 忆 阻 器 和 碳 氧 化 合 物 存 
储 领 域 ， 这 两 种 技术 都 能 蔡 代 旋 转 的 磁盘 。 
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复习 题 


oI 


. 用 文字 表述 阿 姆 达尔 定律 。 
. 什么 是 加 速 比 ? 


什么 是 协议 ? 为 什么 协议 在 VO 总 线 技术 中 非常 重要 ? 


. 列举 3 种 不 同类 型 的 持久 性 存储 器 . 

. 解释 程序 控制 10 与 中 断 驱 动 VO 之 间 有 什么 不 同 。 
. 什么 是 轮流 检测 (或 轮 询 )? 

. 在 中 断 驱动 VO 中 ， 如 何 使 用 地 址 向 量 ? 

.直接 存储 器 存 取 ( DMA ) 的 工作 原理 是 什么 ? 


什么 是 总 线 主 控 设备 ? 

10. 为 什么 DMA 需要 周期 窃取 ? 

11. 当 有 人 将 1/O 看 作为 突 发 式 时 ， 它 表示 的 是 什么 意思 ? 
12. 通道 控制 IO 与 中 断 驱 动 IO 有 什么 不 同 ? 

13. 通道 控制 IO 与 DMA 有 何 相 似 之 处 ? 

14. 什么 是 多 路 复 用 技术 ? 


和 葵 入 /得 由 和 疗 储 系 统 303 





15. 同步 总 线 和 异步 总 线 的 区 别 是 什么 ? 

16. 什么 是 稳定 时 间 ， 在 稳定 时 间 内 可 以 做 些 什么 ? 

17. 为 什么 磁盘 被 称 为 直接 存储 设备 ? 

18. 解释 磁盘 盘 片 、 磁 道 、 扇 区 和 簇 之 间 的 关系 。 

19. 组 成 硬盘 驱动 器 的 主要 物理 部 件 有 哪些 ? 

20. 什么 是 分 区 位 记录 法 ? 

21. 什么 是 寻 道 时 间 ? 

22. 旋转 延迟 和 寻 道 时 间 的 总 和 叫 作 什么 ? 

23. 解释 SSD 和 磁盘 之 间 的 区 别 。 

24. 固态 硬盘 比 磁盘 的 速度 快 多 少 ? 

25. 什么 是 短 行程 ， 它 是 如 何 影响 固态 硬盘 的 相对 成 本 的 ? 

26. 企业 级 SSD 和 笔记 本 电脑 的 SSD 有 什么 不 同 ? 

27. 什么 是 磨损 均衡 ( wear leveling) 技 术 ， 为 什么 固态 硬盘 需要 它 ? 
28. 自动 光盘 库 设备 的 名 称 是 什么 ? 

29. 将 输出 直接 写 到 光学 介质 上 而 不 是 纸 带 或 微缩 胶片 上 的 计算 机 设备 的 缩写 词 是 什么 ? 
30. 磁盘 通过 改变 磁盘 介质 的 磁极 性 来 存储 字 节 ， 那 么 光盘 是 如 何 存 储 字 节 的 呢 ? 
31. 存储 音乐 的 CD 格式 与 存储 数据 的 CD 格式 有 什么 不 同 ， 格 式 之 间 有 什么 相似 之 处 ? 
32， 对 于 长 期 数据 存储 来 说 ， 为 什么 CD 特别 有 用 ? 

33. 存储 数据 的 CD 是 使 用 记录 时 间 段 吗 ? 

34. DVD 如 何 存储 比 CD 多 很 多 的 数据 ? 

35. 解释 为 什么 蓝光 光盘 比 普通 DVD 光盘 能 容纳 更 多 的 数据 。 
36. 写 出 记录 WORM 磁盘 的 3 种 方法 。 

37. 为 什么 磁带 是 一 种 非常 流行 的 存储 介质 ? 

38. 解释 蛇 形 记录 和 螺旋 线 扫描 记录 有 什么 不 同 。 

39. 使 用 蛇 形 记录 的 两 种 流行 格式 是 什么 ? 

40. 哪 一 种 RAID 级 别 能 够 提供 最 好 的 性 能 ? 

41. 哪 一 种 RAID 级 别 最 经 济 ， 而 又 可 以 提供 足够 的 元 余 量 ? 

42. 哪 一 种 RAID 级 别 使 用 镜像 磁盘 组 ? 

43. 什么 是 混合 RAID 系统 ? 

44. 超 顺 磁极 限 的 重要 性 是 什么 ? 

45. 磁盘 驱动 的 超 顺 磁 限 制 意味 着 什么 ? 

46. 请 说 明 全 息 数 据 存储 如 何 工 作 。 

47. MEMS 存储 的 总 体 思 路 是 什么 ? 

48. CNT 存储 如 何 工作 ? 

49. 忆 阻 存储 器 是 什么 ， 它 如 何 存储 数据 ? 


习题 

4 1. 一 个 系统 将 65% 的 时 间 花 费 在 IO 上 ,磁盘 升级 增加 了 50% 的 吞吐 量 ， 求 该 系统 的 总 加 速 比 。 

2. 一 个 系统 将 40% 的 时 间 花 费 在 计算 上 ， 处 理 器 升级 提高 了 100% 的 吞吐 量 ， 求 该 系统 的 总 加 速 比 。 

3. 假设 某 公 司 需 要 使 某 些 繁忙 服务 器 的 速度 提高 50% 。 在 工作 过 程 中 使 用 CPU 花费 60% 的 时 间 ，40% 
的 时 间 花 费 在 IO 上 ， 为 了 实现 25% 的 整体 系统 加 速 : 
a) CPU 需要 快 多 少 ? 
b) 磁盘 需要 快 多 少 ? 

4. 假设 某 公 司 需要 使 某 些 繁忙 服务 器 的 速度 提高 30% 。 在 工作 的 过 程 中 使 用 CPU 花费 70% 的 时 间 ， 
30% 的 时 间 花 费 在 IO 上 ， 为 实现 30% 的 整体 系统 加 速 : 
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a) CPU 需要 快 多 少 ? 
b) 磁盘 需要 快 多 少 ? 


. 假设 你 正 设计 一 个 游戏 系统 ， 它 需要 设计 拨 动 操纵 杆 以 响应 玩家 。 原 型 系统 未 能 及 时 响应 这 些 输 入 事 


件 ， 造 成 玩家 明显 的 烦恼 。 你 已 经 计算 出 需要 整体 提高 系统 性 能 50% ， 也 就 是 说 ， 整 个 系统 需要 比 现 
在 快 50% 。 已 知 这 些 1/0 事件 占 75% 的 系统 负载 。 你 已 知 一 个 新 的 170 接口 卡 应 该 足够 了 。 如 果 系统 
现 有 的 VO 卡 运 行 在 10kHz， 那 么 你 需要 向 供应 商 订购 的 0O 卡 的 速度 是 多 少 ? 


. 假设 你 正在 设计 一 个 电子 乐器 。 原 型 系统 偶尔 会 产生 跑 调 ， 导 致 听众 变 得 迷茫 。 已 经 确定 问题 的 原因 


是 系统 在 处 理 复杂 输入 时 不 堪 重 负 。 你 认为 如 果 能 提高 总 体系 统 性 能 的 12% (使 它 比 现在 快 12% ) ， 
那么 可 以 消除 这 一 问题 。 一 种 选择 是 使 用 更 快 的 处 理 器 。 如 果 处 理 器 占 工作 负载 的 25% ， 而 你 需要 将 
性 能 提升 12% ,那么 新 处 理 器 需要 多 快 ? 


. 你 的 朋友 刚刚 买 了 一 台新 的 个 人 计算 机 。 她 告诉 你 ， 新 系统 的 运行 频率 是 1CHz， 这 使 得 它 比 老 系统 


的 300MHz 多 了 三 们 多。 你 会 告诉 她 什么 ?” (提示 : 考虑 阿 姆 达 尔 定 律 。) 


. 假设 日 常任 务 负 载 由 60% 的 CPU 活动 和 40% 的 磁盘 活动 组 成 。 你 的 客户 抱怨 系统 太 慢 。 进 行 一 些 研 


究 之 后 ， 你 知道 可 以 用 8000 美元 的 价格 升级 磁盘 ， 使 其 达到 目前 速度 的 2. 5 倍 。 你 还 了 解 到 ， 可 以 用 
5000 美元 升级 CPU， 使 其 变 为 之 前 速度 的 1.4 售 。 

a) 选择 哪 种 方案 能 花 最 少 的 钱 获得 最 好 的 性 能 ? 

b) 如 果 不 考 虑 钱 ， 但 需要 一 个 更 快 的 系统 ? 应 选择 哪个 方案 ? 

c) 升级 的 一 亏 平衡 点 在 哪里 ?也 就 是 说 ， 我 们 需要 为 升级 CPU 或 磁盘 。( CPU 或 磁盘 仅 更 换 其 中 的 一 
个 ) 支 付 多 少 钱 使 得 结果 与 两 者 每 增加 1% 的 成 本 相同 ? 

如 果 系 统 活动 由 55% 的 CPU 时 间 和 45% 的 磁盘 活动 组 成 。 你 会 如 何 回答 习题 8。 

阿 姆 达 尔 定律 同样 适用 于 软件 和 硬件 。 一 个 被 引用 的 编程 实践 表明 ， 一 个 程序 花费 90% 的 时 间 执 行 
代码 的 10% 。 因 此 ， 调 整 少量 的 程序 代码 通常 可 能 对 软件 产品 的 整体 性 能 产生 巨大 的 影响 。 根 据 以 
下 条 件 确定 整个 系统 加 速度 比 : 

a) 90% 的 程序 运行 速度 变 为 原来 的 10 倍 ( 快 900% ) 。 

b) 80% 的 程序 是 比 原来 运行 快 20% 

列 出 4 种 类 型 的 IO 架构 。 这 些 WO 架构 通常 在 哪里 使 用 ? 为 什么 ? 

具有 中 断 驱 动 VO 的 CPU 忙于 服务 磁盘 请 求 。 当 CPU 在 执行 磁盘 服务 程序 时 ， 会 发 生 另 一 个 IO 
中 断 。 

a) 那么 接 下 来 会 发 生 什 么 ? 

b) 这 会 出 现 问题 吗 ? 

c) 如 果 不 会 ， 为 什么 ?如 果 会 ， 它 可 以 做 什么 ? 

一 个 普通 的 DMA 控制 器 由 下 列 组 件 组 成 : 

e@ 地 址 发 生 器 

e 地 址 总 线 接口 电路 

e 数据 总 线 接口 电路 

e 总 线 请 求 器 

e 中 断 信号 电路 

e@ 本 地 外 设 控制 器 

本 地 外 设 控 制 器 是 DMA 用 于 与 其 连接 的 外 设 中 进行 选择 的 电路 。 总 线 被 请 求 后 立即 激活 该 电路 。 上 
面 列 出 的 其 他 组 件 的 目的 是 什么 ?它们 何 时 处 于 活动 状态 ? (参看 图 7-6。) 

对 于 程序 控制 的 IO、 中 断 驱 动 IO、DMA 或 通道 IO， 哪 个 最 适合 处 理 VO? 请 解释 原因 。 

a) 鼠标 

b) 游戏 控制 器 

cc) CD 

d) 拇指 驱动 器 或 记忆 棒 

为 什么 VO 总 线 提供 时 钟 信号 ? 
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16. 如 果 地 址 总 线 需 要 寻 址 8 个 器 件 ， 那 么 需要 多 少 根 导线 ? 如果 每 个 设备 还 需要 与 IO 控制 设备 进行 通 
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9 28. 


29. 


信 ， 该 怎么 办 ? 


某 个 数据 总 线 的 协议 如 下 表 所 示 。 绘 制 相应 的 时 序 图 。 您 可 以 参考 图 7-11。 























时 向 显示 总 线 信号 RE 
和 置 位 Read 总 线 需 要 读 取 ( 不 写 ) 
2 置 位 Address 指示 写 人 字 节 的 位 置 
ee 请 求 读 取 地 址 线 上 的 地 址 
人 区 读 取 数据 (需要 几 个 周期 ) 
< Ran， 确认 读 取 请 求 ， 字 节 放 置 在 数据 线 上 
4 降低 Request 不 需要 请 求 信号 
- es 释放 总 线 








关于 图 7-11 和 习题 17， 我 们 没有 提供 错误 处 理 的 任何 类 型 ， 例 如 地 址 线 上 的 地 址 无 效 ， 或 者 由 于 硬 
件 错 误 而 无 法 读 取 存 储 器 。 可 以 用 我 们 的 总 线 模 型 来 提供 这 样 的 事件 吗 ? 

在 本 章 我 们 曾 指出 WO 总 线 并 不 一 定 有 独立 的 地 址 总 线 。 画 出 一 个 类 似 于 图 7-11 所 示 的 时 序 图 ， 对 
于 一 个 写 操作 ， 描 述 在 WO 控制 器 和 磁盘 控制 器 之 间 的 握手 协议 过 程 。( 提示 : 需要 增加 控制 信号 。) 
如 果 图 7-11 中 所 显示 的 时 间 间 隔 为 50ns， 那 么 传输 10 字 节 的 数据 需要 多 长 时 间 ? 请 设计 一 个 总 线 协 
议 ， 它 可 以 减少 传输 过 程 所 需要 的 时 间 ， 控 制 线 的 数目 根据 需要 而 定 。 如 果 去 掉 地 址 线 ， 而 是 使 用 
数据 线 来 代替 地 址 线 ， 那 又 会 发 生 什么 样 的 情况 ? (提示 : 需要 增加 一 根 控制 线 。) 

写 出 寻 道 时 间 、 旋 转 延 迟 和 传输 时 间 的 定义 。 并 解释 它们 之 间 的 相互 关系 。 

你 认为 将 磁盘 驱动 器 说 成 随机 访问 设备 是 用 词 不 当 吗 ? 为 什么 ? 

为 什么 不 同 的 系统 要 把 磁盘 目录 放置 在 磁盘 的 不 同 磁道 上 ? 说 明 使 用 各 自 的 目录 位 置 有 什么 优点 ? 
验证 图 7-15 所 示 的 磁盘 说 明 书 中 的 平均 延迟 时 间 。 在 这 个 计算 中 为 什么 要 除 以 2? 

通过 仔细 检查 图 7-15 所 示 的 磁盘 说 明 书 ， 你 认为 这 个 磁盘 驱动 器 是 否 使 用 分 区 位 记录 方式 ? 

在 图 7-15 所 示 的 磁盘 说 明 书 中 给 出 了 从 磁盘 中 读 取 数据 时 的 数据 传输 率 为 60MB/s， 而 向 磁盘 写 入 数 
据 时 的 数据 传输 率 为 320MB/s。 为 什么 这 两 个 数据 会 不 同 ? (提示 : 考虑 缓冲 。) 


你 是 否 相信 磁盘 驱动 器 中 所 给 的 MTRR 数字 ? 请 解释 原因 。 


假定 磁盘 驱动 器 具有 如 下 特性 : 
e@ 有 4 个 记录 面 

@ 每 个 面 有 1024 个 磁道 

@ 每 个 磁道 有 128 个 扇 区 

@ 512 字 节 / 扇 区 

e@ 磁道 到 磁道 的 寻 道 时 间 为 Sms 
@ 旋转 速率 为 5000r/min 

a) 驱动 器 的 容量 是 多 少 ? 

b) 访问 时 间 是 多 少 ? 

假定 磁盘 驱动 器 具有 如 下 特性 : 
e@ 5 个 记录 面 

@ 每 个 面 有 1024 个 磁道 

e@ 每 个 磁道 有 256 个 而 区 

e 512 字 节 / 刷 区 

e@ 磁道 到 磁道 的 寻 道 时 间 为 8ms 
e@ 旋转 速率 为 7500r/min 

a) 磁盘 驱动 器 的 容量 是 多 少 ? 

b) 访问 时 间 是 多 少 ? 
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c) 这 个 磁盘 是 否 比 第 28 题 中 描述 的 磁盘 快 ? 请 解释 原因 。 


. 假设 磁盘 驱动 器 具有 以 下 特征 : 


e@ 6 个 记录 面 

e 每 个 面 有 16 383 个 磁道 

每 磁道 有 63 个 扇 区 

512 字 节 / 扇 区 

磁道 到 磁道 的 寻 道 时 间 为 8. Sms 
旋转 速度 为 7200r/ min 

a) 人 磁盘 驱动 器 的 容量 是 多 少 ? 

b) 访问 时 间 是 多 少 ? 

假设 磁盘 驱动 器 具有 以 下 特征 : 

e@ 6 个 记录 面 

e 每 个 面 有 953 个 磁道 

e 每 个 磁道 有 256 个 扇 区 

@ 512 字 节 / 扇 区 

磁道 到 磁道 的 寻 道 时 间 是 6. Sms 
@ 转速 为 5400r/min 

a) 磁盘 驱动 器 的 容量 是 多 少 ? 

b) 存 取 时 间 是 多 少 ? 

c) 这 个 磁盘 比 第 30 题 中 描述 的 磁盘 快 吗 ? 请 说 明理 由 。 


.磁盘 驱动 器 的 传输 速率 可 能 不 比 磁盘 转速 的 位 密度 ( 位 /磁道 ) 要 快 。 图 7-15 给 出 了 112GB/s 的 数据 


传输 速率 。 假 设 磁盘 的 磁道 平均 长 度 为 5. Sn。 磁盘 的 平均 位 密度 是 多 少 ? 


.每 个 磁盘 块 只 有 少量 扇 区 的 优点 和 缺点 分 别 是 什么 ?” (提示 : 考虑 检索 时 间 和 存档 所 需 的 生命 周期 。) 
. 光盘 的 组 织 结构 与 磁盘 的 组 织 结构 有 哪些 不 同 ? 

.SSD 的 结构 与 磁盘 有 何 区 别 ? 它 与 磁盘 有 哪些 相似 点 ? 

. 在 7.6.2 节 中 ,我们 说 磁盘 与 主 存 相 比 功 耗 较 大 。 为 什么 这 样 是 对 的 ? 

. 解释 磨损 均衡 ， 以 及 SSD 需要 它 的 原因 。 我 们 说 ， 对 于 连续 更 新 的 虚拟 存储 器 页 面 文件 磨损 均衡 至 


关 重 要 。 页 面 文件 的 磨损 加 剧 了 什么 问题 ? 


. 分 别 比较 图 7-15 和 图 7-17 所 示 的 HDD 和 SSD 的 磁盘 说 明 书 。 它 们 有 哪些 地 方 相同 ? 为 什么 ? 有 哪 


些 不 同 ? 为 什么 ? 

如 果 800GB 服务 器 级 的 HDD 耗资 300 美元 ,每 千瓦 时 电力 成 本 为 0. 10 美元 ,设备 成 本 0. 01 美元 / 
GB/ 月 ,使 用 图 7-15 中 的 磁盘 说 明 书 来 确定 在 线 存储 8TB 数据 5 年 需要 花费 多 少 钱 。 假 设 HDD 25% 
的 时 间 很 活跃 。 可 以 采取 什么 措施 来 减少 这 个 费用 ? (提示 : 使 用 图 7-15 中 的 “ 读 / 写 ” 和 “空闲 ” 
时 的 电源 要 求 。 使 用 下 面 的 表格 作为 参考 。) 


| 每 FRR 有 0 | 


活跃 时 所 耗 功率 /W 


Ee 
| 
汉王 











闲置 时 所 耗 功率 /W 
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连接 到 公司 服务 器 群 中 的 服务 器 的 磁盘 驱动 器 即将 到 达 使 用 寿命 。 管 理 层 正在 考虑 用 SSD 替代 容量 
为 8TB 的 磁盘 。 有 人 提出 这 样 的 观点 : SSD 和 传统 磁盘 之 间 的 成 本 差异 将 被 SSD 的 节 电 成 本 所 抵消 。 
800GB SSD 售 价 900 美元 。800GB 服务 器 级 HDD 的 成 本 为 300 美元 。 使 用 图 7-15 和 图 7-17 所 示 的 磁 
盘 说 明 书 来 确认 或 驳回 此 声明 。 假 设 HDD 和 SSD 都 在 25% 的 时 间 内 活跃 ， 并 且 电 费 为 0. 10 美元 / 
kW h。 提示: 使 用 图 7-15 中 的 “ 读 / 写 ”和 “空闲 ” 电 源 要 求 。 

一 家 从 事 需 要 快速 响应 时 间 的 业务 公司 刚刚 收 到 了 一 个 新 系统 的 报价 ， 该 系统 的 存储 空间 比 需 求 文 
档 中 规定 的 大 。 当 该 公司 质疑 供应 商 为 何 增加 存储 量 时 ， 供 应 商 表 示 ， 他 正在 投标 一 组 该 公司 生产 
的 具有 最 小 容量 的 磁盘 驱动 器 。 为 什么 供应 商用 较 小 的 磁盘 ? 


. 讨论 DLT 和 DAT 记录 数据 方式 之 间 的 区 别 。 并 说 明 你 为 什么 会 认为 其 中 一 种 方式 比 另 一 种 更 好 些 ? 
. 光学 文件 存储 系统 的 纠 错 要 求 与 以 文本 形式 存储 的 相同 信息 的 纠 错 要 求 有 何不 同 ? 对 于 光学 存储 设 


备 来 说 ， 使 用 不 同 级 别 的 纠 错 有 何 优点 ? 


. 假设 需要 存档 大 量 的 数据 ， 你 正在 纠结 是 要 使 用 磁带 存储 方法 还 是 光学 存储 方法 。 这 种 数据 有 什么 


特性 ? 并 说 明 为 什么 会 做 出 这 样 的 选择 ? 


. 讨论 使 用 磁盘 与 磁带 进行 备份 的 利 瞪 。 
. 假设 你 有 一 个 100GB 的 数据 库 ， 它 存放 在 一 个 支持 60MB/s 传输 率 的 磁盘 阵列 上 ， 而 磁带 驱动 器 则 支 


持 200GB 的 容量 ,传输 速率 为 80MB/s。 备 份 数据 库 需 要 多 长 时 间 ? 如 果 可 以 进行 2: 1 的 压缩 ， 那 么 
传输 时 间 是 多 少 ? 

某 网 络 电子 商务 服务 器 使 用 了 一 台 特 殊 的 高 性 能 计算 机 系统 。 这 个 系统 每 小 时 可 以 完成 10 000 美元 
的 交易 量 。 估 计 的 纯利 润 是 每 小 时 1200 美元 。 换 句 话 说， 如 果 系 统 骨 溃 了 ， 那 么 该 公司 每 小 时 将 损 
失 1200 美元 ， 直 到 系统 修复 好 为 止 。 而 且 ， 损 坏 磁盘 上 的 任何 数据 都 会 丢失 。 其 中 有 些 数据 可 以 在 
昨 晚 备份 的 数据 中 重新 找到 ， 而 其 余 的 数据 将 会 永远 丢失 。 可 以 想象 ,一 个 难以 控制 的 磁盘 损坏 可 
能 直接 导致 公司 几 十 万 美元 的 损失 ， 以 及 数 千 万 美元 的 永久 性 商业 损失 。 事 实 上 ， 困 扰 你 的 问题 是 
这 个 系统 目前 没有 使 用 任何 类 型 的 RAID 系统 。 

也 许 你 主要 关心 的 问题 是 数据 完整 性 和 系统 可 用 性 ， 然 而 小 组 中 的 其 他 成 员 可 能 更 关注 系统 性 
能 。 他 们 觉得 如 果 安 装 了 RAID ， 系 统 的 速度 会 变 慢 ， 从 长 远 的 观点 来 看 ， 可 能 会 造成 更 多 的 损失 。 
他 们 特别 指出 ， 如 果 带 有 RAID 的 系统 的 运行 速度 只 有 当前 系统 的 一 半 ， 那 么 将 会 导致 每 小 时 的 总 收 
入 下 降 到 5000 美元 。 

系统 的 80% 电子 商务 活动 会 涉及 数据 库 的 事务 处 理 。 数 据 库 的 事务 处 理由 60% 的 读 操作 和 40% 
的 写 操作 组 成 。 平 均 来 说 ， 磁 盘 的 访问 时 间 是 20ms。 

现在 ， 该 系统 的 磁盘 空间 已 经 基本 用 完 ， 而 且 所 有 磁盘 的 预期 寿命 也 接近 结束 ， 所 以 马上 必须 
预定 新 的 磁盘 来 代替 它们 。 于 是 你 觉得 这 是 一 个 安装 RAID 的 好 时 机 ， 当 然 还 需 购买 一 些 额 外 的 磁 
盘 。 你 找到 了 一 种 适合 本 系统 的 磁盘 ， 每 一 个 容量 10CB 的 磁盘 价格 为 2000 美元 。 新 磁盘 的 平均 访 
问 时 间 是 15ms，MTTF 为 20 000h 而 MTTR 为 4h。 预 计 需 要 60GB 的 存储 容量 来 保存 现 有 的 数据 和 预 
期 随后 5 年 内 可 能 增加 的 数据 。( 将 原来 的 所 有 磁盘 替换 掉 。) 

a) 对 于 反对 在 系统 中 增加 RAID 的 人 来 说 ， 他 们 有 关 磁 盘 速 度 减 慢 50% 将 会 导致 收入 下 降 到 每 小 时 

5000 美元 的 断言 是 否 正确 ? 并 证 明 你 的 答案 。 

b) 如 果 你 决定 采用 RAID-1， 那 么 在 新 系统 中 平均 磁盘 访问 时 间 是 多 少 ? 
c) 如 果 系统 使 用 一 个 带 有 两 组 4 磁盘 的 RAID-5 阵列 ， 而 且 25% 的 数据 库 事务 处 理 时 间 用 来 等 待 某 

个 事务 处 理 完毕 直到 该 磁盘 空闲 ， 那 么 平均 磁盘 访问 时 间 又 为 多 少 ? 

d) 对 于 RAID-1 和 RAID-5， 哪 一 种 配置 的 成 本 费用 更 加 合理 一 些 ? 并 解释 理由 。 


. a) 在 本 章 所 介绍 的 RAID 系统 中 ， 哪 一 种 系统 不 允许 有 单 磁盘 失效 ? 


b) 哪 一 种 系统 可 以 允许 多 个 磁盘 同时 失效 ? 
我 们 对 RAID 的 讨论 偏向 于 考虑 标准 旋转 磁盘 。SSD 存储 是 否 需 要 RAID? 如 果 没 有 ， 这 是 否 使 得 SSD 
存储 对 于 企业 来 说 更 为 实惠 ?” 如 果 有 必要 ， 宛 余 磁 盘 是 否 也 必须 是 SSD? 





特别 关注 : 数据 压缩 

7A.1 引言 

无 论 存储 器 多 便宜 ， 也 不 管 购买 的 数量 是 多 少 ， 我 们 似乎 从 来 都 不 会 认为 存储 器 系统 
已 经 足够 。 新 购买 的 巨大 磁盘 通常 很 快 就 会 装 满 原 本 希望 存放 在 老 磁盘 上 的 内 容 。 不 久 ， 
我 们 就 又 开始 在 市 场 上 购买 另 一 组 新 的 磁盘 系统 。 很 少 有 人 或 公司 可 以 拥有 无 限 的 资源 ， 
因此 我 们 必须 对 现 有 的 资源 进行 优化 。 一 个 优化 方法 就 是 使 要 存储 的 数据 变 得 更 加 紧凑 ， 
在 写 入 磁盘 之 前 对 数据 进行 压缩 。( 实 际 上 ， 可 以 使 用 压缩 技术 为 奇偶 校 验 或 镜像 磁盘 组 
留 出 空间 , “免费 ”为 系统 增加 RAID!) 

数据 压缩 除了 节省 空间 外 还 有 很 多 的 好 处 。 它 同样 也 能 节省 时 间 和 帮助 优化 资源 。 例 
如 ， 如 果 压 缩 和 解压 的 操作 都 在 I/O 处 理 器 上 执行 ， 那 么 数据 移入 和 移出 存储 器 子 系统 所 
需要 的 时 间 就 会 更 少 ， 这 样 系统 就 会 有 更 多 的 时 间 让 I/O 总 线 做 其 他 工作 。 

在 通信 线路 中 使 用 数据 压缩 技术 发 送信 息 所 带 来 的 好 处 是 显而易见 的 : 数据 传输 的 时 
间 更 短 和 在 主机 上 存放 数据 所 占用 的 空间 也 会 更 少 。 尽 管 这 个 问题 的 细节 研究 已 经 超出 了 
本 书 的 范围 (参阅 本 章 的 参考 文献 可 以 获取 一 些 资料 )， 但 是 要 想 全 面 理解 /0 和 数据 存储 
还 应 该 了 解 有 关 数 据 压缩 的 一 些 基本 概念 。 

在 评估 不 同 的 压缩 算法 和 压缩 硬件 时 ， 我 们 通常 最 关心 的 是 压缩 算法 执行 的 速度 ， 使 
用 这 种 数据 压缩 算法 后 一 个 文件 会 变 得 有 多 小 。 压 缩 系数 ， 有 时 称 为 压缩 比 ， 是 一 个 可 以 
快速 计算 的 统计 量 。 事 实 上 ， 人 们 很 容易 理解 这 个 问题 。 计 算 压 缩 系 数 有 多 种 不 同 的 方 
法 。 这 里 。 采 用 如 下 的 计算 方法 : 

压缩 系数 = 1 ~ (压缩 后 的 文件 大 小 /压缩 前 的 文件 大 小 ) x 100% 

例如 ， 假 设 有 一 个 100KB 的 文件 ， 然 后 使 用 某 种 压缩 算法 对 文件 进行 压缩 处 理 。 在 算法 完 
成 后 ， 文 件 的 大 小 变 成 了 40KB。 因 此 、 该 特定 文件 所 实现 的 压缩 比 为 [1 ~ (40/100)]x 
100% =60% 。 在 推断 出 这 一 算法 总 是 可 以 产生 60% 的 文件 压缩 的 结论 之 前 ， 我 们 应 该 进 
行 大 量 的 统计 研究 。 然 而 ， 一 旦 具备 了 少许 理论 背景 知识 后 ， 我 们 就 能 够 确定 某 种 压缩 算 
法 对 于 一 些 特定 信息 或 信息 类 型 的 期 望 压 缩 比 。 

数据 压缩 技术 属于 信息 理论 这 个 更 大 研究 领域 内 的 一 个 分 支 。 信 息 理论 是 研究 信息 存 
储 和 编码 方式 的 科学 。 这 种 理论 由 贝尔 实验 室 的 一 位 科学 家 克 劳 德 * 香农 在 20 世纪 40 年 
代 创 建 的 。 香 农 建立 了 很 多 信息 度量 的 方法 ， 其 中 最 基本 的 内 容 是 粒 。 炳 用 来 测量 一 个 消 
息 中 的 信息 量 。 具 有 较 高 粹 的 消息 比 有 较 低 粹 的 消息 载 有 更 多 的 信息 。 这 种 定义 意味 着 一 
个 载 有 较 低 信息 量 的 消息 会 比 一 个 载 有 较 高 信息 量 的 消息 压缩 到 更 小 的 容量 。 

要 想 确 定 一 个 信息 的 灶 ， 首 先 需要 确定 这 条 消息 中 每 个 符号 的 频率 。 你 很 容易 按照 概 
率 来 思考 符号 频率 这 个 概念 。 例 如 ， 在 如 下 著名 的 程序 输出 语句 : 

HELLO WORLD! 
字母 世 出 现 的 频率 是 3/12 或 者 1/4。 使 用 符号 表示 ， 则 为 P(L) =0.25。 ,为 了 将 该 概率 映射 为 
某 个 编码 字 中 的 二 进 制 位 ， 将 概率 取 以 2 为 底 的 对 数 (log)。 这 里 ， 编 码 字母 L 所 需要 的 最 小 
位 数 为 : -log;P(L) =2。 消 息 的 粹 是 在 该 消息 中 编码 每 个 符号 所 需要 的 二 进 制 位 数 的 加 权 平 
均值 。 如 果菜 个 符号 % 出 现在 一 个 消息 中 的 概率 为 P(x)， 那 么 该 字符 x 的 炳 五 为 : 

H =-P(x) x log,P(x) 
整个 消息 的 平均 精 则 是 对 消息 中 所 有 普 个 符号 出 现 的 概率 加 权 求 和 : 


> — P(x,) x log,P(%,) 
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灶 为 编码 一 个 消息 所 需 的 二 进 制 位 数 设立 了 一 个 低 的 限制 。 特 别 是 ， 如 果 将 整个 消息 
的 字符 数 乘 以 加 权 灶 值 ， 在 理论 上 就 得 到 了 编码 一 个 消息 而 不 丢失 信息 所 需要 的 最 少 三 进 
制 位 数 。 这 个 低 限 外 的 其 他 位 并 不 会 增加 信息 ， 因 此 这 些 位 是 完 余 的 。 数 据 压缩 的 目的 是 
在 保留 原 有 信息 量 的 同时 除去 元 余 性 。 在 长 度 为 1 的 原 信 息 可 以 有 一 个 长 度 为 n 的 编码 中 ， 
每 个 字符 的 平均 匈 余 量 可 以 用 下 面 的 公式 进行 量化 处 理 : 


> - -P(x,) xil,— > - — P(x,) x log,P(x,) 


当 对 某 个 给 定 消息 比较 各 种 编码 方案 的 有 效 性 时 ， 这 个 公式 非常 有 用 。 按 照 数据 压缩 的 观 
点 ， 编 码 一 个 消息 时 ， 具有 最 少 宛 余 量 的 编码 方案 是 比较 好 的 编码 方案 。( 当然 ， 我 们 还 
必须 考虑 完成 编码 的 速度 和 计算 的 复杂 性 ， 以 及 应 用 程序 的 细节 问题 ， 最 后 才能 确定 哪 种 
方法 更 好 。) 

上 面 公 式 的 一 个 直接 应 用 是 求 一 个 文本 消息 的 粹 和 宛 余 。 如 果 使 用 定 长 的 编码 方式 
(例如 ASCI 或 者 EDCDIC)， 上 式 左 边 的 和 就 是 编码 长 度 ， 通 常 为 8 位 。 在 HELLO 
WORLD!1 的 例子 中 ， 通 过 利用 上 式 右边 的 求 和 ， 我 们 发 现 平均 符号 精 大 约 是 3.022。 这 意 
味 着 如 果 达 到 理论 上 的 最 大 灶 值 ， 只 需 使 用 3. 022 位 /字符 x12 个 字符 =36.26 或 37 位 来 
对 整 条 消息 进行 编码 。 因 此 ， 在 这 条 消息 的 8 位 ASCIT 编码 的 表示 形式 中 就 有 96 -37 或 59 
个 宛 余 位 。 
7A.2 统计 编码 

上 面 所 描述 的 炳 的 量度 方法 可 以 作为 设计 压缩 编码 的 基础 ， 利 用 设计 编码 方法 可 使 压 
缩 消 息 中 的 宛 余 最 小 化 。 一 般 来 说 ， 采 用 统计 编码 的 压缩 过 程 相 对 较 慢 ， 而 且 与 VO 过 程 
密切 相关 。 在 消息 被 压缩 和 写 入 存储 嚣 之前， 系统 需 要 两 次 遍历 文件 。 

要 求 两 次 遍历 文件 原因 是 ， 第 一 次 遍历 只 是 用 来 计算 每 一 个 符号 出 现 的 次 数 。 计 数值 
用 来 计算 每 一 个 不 同 符号 在 源 消息 中 出 现 的 概率 。 我 们 会 按照 所 计算 的 概率 对 源 消息 中 的 
每 一 个 符号 赋值 。 随 后 ， 最 新 的 赋值 会 与 编码 该 文件 所 需 的 一 些 信 息 一 起 写 入 到 文件 中 。 
如 果 这 个 编码 文件 连同 编码 该 文件 所 需 的 赋值 表 ， 比 原来 的 文件 要 小 ， 那 么 我 们 就 说 发 生 
了 数据 压缩 。 

赫 夫 曼 (Huffman) 编码 和 算术 编码 是 两 种 基本 的 统计 数据 压缩 方法 。 在 大 量 流行 的 压 
缩 程 序 中 ， 可 以 找到 这 两 种 方法 的 某 些 变化 形式 。 在 下 面 章节 中 将 检查 研究 这 两 种 方法 ， 
首先 从 赫 夫 时 编码 开始 。 

7A.2.1 赫 夫 曼 编 码 

假设 在 确定 了 源 消 息 中 每 个 符号 的 概率 后 ， 需 创建 一 个 可 变 长 度 的 编码 来 将 最 短 的 纺 
码 字 分 配给 使 用 频率 最 高 的 符号 。 如 果 这 个 编码 字 短 于 信息 字 ， 那 么 压缩 后 的 消息 显然 也 
会 比 信息 字 要 短 。 大 卫 . A. 夫 夫 曼 在 1952 年 
发 表 的 论文 中 描述 了 这 个 观点 。 摩 尔 斯 
(Morse) 编 码 是 19 世纪 开始 出 现 的 编码 形式 ， 
它 是 赫 夫 曼 编 码 ( Huffman coding ) 的 一 种 形式 。 

摩尔 斯 编码 是 根据 英文 著作 中 各 个 字母 典 
型 的 使 用 频率 来 设计 的 。 从 图 7A-1 中 可 以 看 
出 ， 较 短 的 编码 代表 了 英语 中 使 用 频率 较 高 的 
字母 。 这 种 统计 的 频率 显然 不 适用 于 单一 的 消 
息 。 一 个 值得 注意 的 例外 情况 是 在 桑 给 巴尔 度 图 7A-1 摩尔 斯 国际 代码 








假 的 卡 扎 里 未 叔 发 来 的 一 封 电报 ， 他 想 要 几 块 钱 以 便 能 喝 1qt(1qt =0;946L) 的 杜 宁 ! 因此 ， 
对 每 条 消息 来 说 最 准确 的 统计 模型 都 需要 单独 加 以 考虑 。 为 了 准确 分 配 各 个 编码 字 ， 替 夫 
曼 算 法 会 利用 从 源 消息 中 求 出 的 符号 概率 来 构建 一 个 二 进 制 树 。 树 的 遍历 给 出 了 消息 中 每 
个 符号 的 位 图 分 配 形式 。 我 们 用 一 个 简单 的 童谣 来 说 明 这 一 处 理 过 程 。 为 了 清晰 起 见 ， 我 
们 将 童谣 写成 如 下 没有 标点 符号 全 部 为 大 写字 母 的 组 成 形式 : 

HIGGLETY PIGGLETY POP 

THE DOG HAS EATEN THE MOP 

THE PIGS IN A HURRY THE CATS INA FLURRY 

HIGGLETY PIGGLETY POP 

我 们 把 童谣 中 每 个 字符 出 现 的 次 数 写成 表格 形式 。 并 且 使 用 缩写 符号 <WS>( 空 白 ) 
来 表示 单词 间 的 空格 字符 和 换行 字符 。( 参见 表 7A-1) 


表 7A-1 字母 出 现 的 频率 
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这 些 字母 出 现 的 频率 与 利用 树 的 两 个 节点 的 每 个 字母 关联 。 这 时 此 树 的 集合 ( 称 为 森 
林 ) 按照 字母 出 现 的 频率 大 小 排列 成 如 下 的 直线 形式 : 


60966066660000000698 
(D) OV IDYODDVDAD 
下 面 通过 将 两 个 频率 最 小 的 节点 连接 起 来 开始 构建 二 进 制 树 。 因 为 频率 最 小 的 节点 有 4 个 ， 


所 以 可 以 任意 选择 最 左 端 的 两 个 节点 。 这 两 个 节点 的 组 合 频率 和 为 2。 接 着 ,创建 一 个 标 
记 该 频率 和 的 父 节 点 ,并 且 将 它 放 回 到 森林 中 ， 父 节点 标记 所 决定 的 位 置 ， 如 下 图 所 示 : 


RA 
A 


两 个 最 小 节点 是 F、M、C、D 的 父 节点 。 将 它们 放 在 一 起 ; 相 加 的 频率 和 为 4， 它 们 位 于 
从 左边 开始 的 第 四 个 位 置 : . 
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06g 66060609668 
GOQOOVOCOOOS 
WOVYVD 
(DWOD 
最 左 端 两 个 节点 的 频率 相 加 等 于 5， 于 是 要 将 它们 移 到 树 中 的 新 位 置 上 ， 如 下 图 所 示 : 
6d966600600666 
(2 Oboe VOODOOD 
WOVYV VY 
DO 
现在 两 个 六 水 节 皮 均 需 素 各 各 壬 二 353 寺 妆 科普 汕 妆 的 沈 沁 的， 着 和 拘 先生 


A 







现在 将 最 左 端的 两 个 节点 组 合 起 来 创建 一 个 频率 为 8 的 父 节点 ， 并 将 它 放 回 到 森林 中 ， 如 
下 图 所 示 : 
006g bogoo66ooe8 
DODDODY 让 二 四 四 四 
(DW 2 CGO 


经 过 多 次 的 迭代 过 程 ， 最 后 树 的 形状 如 下 图 所 示 : 
9 
过 9 
Do G0 G9 
9 (EI A 9 a 29 
DG A OO 8 VY OO AO 
DO DO 四 四 DO 
GO DG 
WVYVY (DW 
(MOD 





该 树 构建 了 一 个 框架 ， 由 此 可 以 给 消息 中 的 每 个 符号 分 配 一 个 赫 夫 曼 编 码 值 。 利 用 二 进 制 
数 1 来 标记 二 又 树 中 每 一 条 右 分 支 ， 而 二 又 树 的 每 一 条 左 分 支 则 标记 为 0。 其 结果 如 下 图 
所 示 。( 删 除了 频率 节点 以 使 图 看 起 来 更 加 清楚 。) 





现在 我 们 所 要 做 的 事情 就 是 从 树 根 节点 出 发 遍历 每 一 个 叶 节点 ， 并 记录 下 沿途 所 过 到 
的 二 进 制 数 字 。 这 样 ， 所 完成 的 编码 方案 如 表 7A-2 所 示 。 


























3 表 7A-2 编码 方案 

字母 编码 字母 编码 
<Wws> 01 0 10100 
下 000 R 10101 
| 0011 110100 
I 1001 110101 
H : 1011 1000100 
p ET 1000101 
E 1110 1000110 
G ki 1000111 
3 10000 


可 以 看 出 ， 频 率 最 高 的 符号 在 编码 中 占用 最 少 的 位 。 这 个 消息 的 平均 粹 大 约 为 3.82 位 / 
符号 。 理 论 上 对 这 个 信息 进行 压缩 的 低 限 为 110 个 符号 x3.82 位 =421 位 。 赫 夫 曼 编码 对 这 
个 消息 实际 给 出 的 编码 位 数 是 426 位 ， 或 者 说 比 理论 上 所 需要 的 最 少 位 数 大 约 多 出 了 1%。 

7A.2.2 算术 编码 

从 理论 上 来 说 ， 替 夫 曼 编码 通常 不 能 实现 最 佳 压 缩 。 这 是 因为 蔡 夫 受 编 码 在 结果 编码 
中 要 限制 使 用 的 整数 位 数 。 在 上 节 介 绍 的 童谣 中 ， 符 号 S 的 精 约 为 1. 58。 一 个 最 佳 代码 会 
使 用 1. 58 位 对 每 次 出 现 的 符号 S 进行 编码 。 如 果 采 用 页 夫 曼 编码 方法 ， 最 少 要 使 用 2 位 二 
进 制 位 进 制 编码 。 这 种 精度 上 的 欠缺 使 得 最 后 结果 多 出 了 5 个 元 余 位 。 当 然 ， 这 种 情况 还 
不 算 太 坏 ， 但 是 看 起 来 我 们 还 可 以 做 得 更 好 一 些 。 

赫 夫 曼 编 码 不 能 达到 最 佳 的 编码 效果 ， 这 是 因为 它 所 采用 的 概率 映射 方式 。 也 就 是 说 
赫 夫 曼 编 码 要 将 实数 集中 的 元 素 映 射 为 整数 子 集中 的 元 素 。 正 因为 如 此 ， 我 们 肯定 会 遇 到 
上 面 的 间 题 ! 那么 为 什么 不 能 设计 一 种 实数 对 实数 的 映射 形式 来 实现 数据 压缩 呢 ? 1963 
年 ， 诺 曼 。 艾 布 拉 姆 森 就 设想 出 了 这 种 映射 方式 ,随后 由 彼得 * 伊 莱 亚 斯 发 表 了 。 这 种 实 
数 对 实数 的 数据 压缩 方法 称 作 算术 编码 。 
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从 概念 上 来 说 ,算术 编码 是 在 消息 符号 集中 利用 概率 在 0 和 1 之 间 分 割 实数 轴 s 使 用 
越 频 繁 的 符号 ， 分割 所 得 到 的 区 间 块 就 越 大 。 

回 到 大 家 喜爱 的 程序 输出 : HELLO WORLD! 不 难看 出 ， 这 个 命令 式 语 名 中 共有 12 个 字 
符 。 在 这 些 符 号 中 最 低 的 概率 是 1/12。 而 所 有 其 他 概率 都 是 1/12 的 整数 倍 。 因 此 ， 可 将 0 到 
1 之 间 的 区 间 划 分 为 二 段 。 除 了 L 和 0 外， 其 他 每 个 符号 都 得 到 了 1/12 的 区 间 。 符 号 LL 和 0O 
则 分 别 获得 了 3/12 和 2/12 的 区 间 。 概 率 和 区 间 之 间 的 映射 关系 如 表 7A-3 所 示 。 


表 7A-3 HELLO WORLD! 概率 区 间 的 映射 关系 
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通过 连续 地 划分 与 符号 所 分 配 区 间 成 比例 的 数值 范围 (从 0.0 开 始 到 1.0 结束 ) 可 以 对 消 
息 进行 编码 。 例如， 假如 当前 的 区 间 位 置 是 1/18， 而 字母 工 获得 了 当前 区 间 的 1/4， 如 上 所 
示 ， 接 下 来 对 符号 工 进 行 编码 , 将 1/8 乘 以 1/4 得 到 1/32， 它 是 字符 让 当前 新 的 区 间 。 如 果 
下 一 个 字符 是 另外 一 个 字母 二 ， 那 么 将 1/32 再 乘 以 1/4 又 可 以 得 到 当前 的 区 间 值 为 1/128。 这 
个 编码 过 程 一 直 会 持续 下 去 ， 直 到 整 条 消息 编码 完成 。 在 学 习 了 下 面 的 伪 代 码 后 ， 这 个 编码 
过 程 就 会 变 得 非常 清楚 。 有 关 输 出 HELLO WORLD! 的 伪 代 码 的 详细 描述 如 图 7A-2 所 示 。 


ALGORITHM Arith Code (Message) \ 
HiVal < 1.0 /* Upper limit of interval. */ 
LoVal < 0.0 /* Lower limit of interval. */ 
WHILE (more characters to process) 
Char < Next message character 
Interval < HiVal - LoVal 
CharHiVal «< Upper interval limit for Char 
CharLoVal < Lower interval limit for Char 
HiVal < LoVal + Interval * CharHiVal 
LoVal < LoVal + Interval * CharLoVal 

ENDWHILE 

OUTPUT (LoVal) 

END Arith Code 








| 符号 | 。 区 间 | 字符 低位 信 | 字 符 高 位 信 | 。 低位 值 。 | 。 高 位 值 | 
Se 7 
a 其 0 二 和 二 王后 
E00 | 0083 | 0167 |0173869 |00861 | 
0 [oo0043575 | 05 | 0667 |0176785675 [0.176358395 | 
[0 | 0.00000050735| 05 | 0667 |0.1763510808 |0.1763511655 | 
LR | 0.00000008473| 0.667 | 075 |0.1763511373 |0.1763511444 | 
5D 000000000176| 0 | 0083 |0.1763511391 |0.1763511392 | 
| 000000000015| 097 | 1 10.176351139327|0.176351139239| 
| 


图 7A-2 利用 算术 编码 方式 对 HELLO WORLD! 进行 编码 





利用 这 一 编码 过 程 的 反 过 程 可 以 对 消息 进行 译 码 ， 下面 给 出 了 译 码 过 程 的 伪 代 码 。 而 
图 7A-3 给 出 的 是 上 述 伪 代码 的 跟踪 过 程 。 


ALGORITHM Arith Decode (CodedMsg) 
Finished < FALSE 
WHILE NOT Finished 
FoundChar < FALSE /* We could do this search much more */ 
WHILE NOT FoundChar /* efficiently in a real implementation. */ 
PossibleChar « next symbol from the code table 
CharHiVal < Upper interval limit for PossibleChar 
CharLoVal < Lower interval limit for PossibleChar 
IF CodedMsg < CharHiVal AND CodedMsg > CharLoVal THEN 
FoundChar < TRUE 
ENDIF / * We now have a character whose interval */ 
ENDWHILE /* surrounds the current message value. */ 
OUTPUT (Matching Char) 
Interval < CharHiVal - CharLoVal 
CodedMsgInterval < CodedMsg - CharLoVal 
CodedMsg < CodedMsgInterval / Interval 
IF CodedMsg = 0.0 THEN 
Finished < TRUE 
ENDIF 
END WHILE 
END Arith Decode 


es en, lon 
T0167 | 035 | 0083 | 0009351139557 | 0112664328032 | 
0s 007 | 0167 | O15054819664 | 00028860265 | 
sp | 0833 | 0917 | 0084 | 0.0673886077 | 0.8010547935 | 
Ww | 075 | 0833 | 0083 | 0051054793 | 0615117994 | 
0 | 63 | 067 | 0167 | O51799 | 06893393 | 
RR | 0667 | 075 | 0083 | 00333793 | 03690378 | 
rr | 0 | 05 [03%0 [Ons | Ort | 
Do ons [no | 00 |097 | 
ET 和 本 区 1 天上 二 、 基 和 要 | 放 二， 和 池 


图 7A-3 解码 HELLO WORLD! 的 跟踪 过 程 


大 家 可 能 已 经 注意 到 算术 编码 /解码 算法 都 没有 包括 任何 一 种 类 型 的 错误 检测 。 之 所 
以 这 样 做 ,是 为 了 更 加 清楚 地 描述 问题 。 真 正 实现 算术 编码 时 ， 不 但 要 保证 在 编码 结果 中 
有 足够 的 位 数 来 满足 信息 粹 的 要 求 ， 而 且 还 要 防止 浮 点 数 下 滋 的 情况 发 生 。 

当 对 消息 进行 解码 时 ， 浮 点 数 表示 法 的 差异 也 可 能 引起 算术 编码 算法 发 生 丢 失 0 的 情 
况 。 事 实 上 ， 在 编码 过 程 中 总 会 在 消息 的 尾部 插入 一 个 结束 字符 以 防止 在 解码 时 出 现 丢 失 
0 的 情况 。 


7A.3 Ziv-Lempel(LZ) 字 典 系 统 

尽管 算术 编码 方法 几乎 可 以 获得 最 佳 的 数据 压缩 ,但 是 它 的 速度 比 赫 夫 曼 编码 方法 还 
慢 。 这 是 因为 在 编码 和 译 码 过 程 中 ,算术 编码 方法 必须 要 执行 浮 点 操作 。 如 困 速 度 是 首要 
关心 的 问题 ， 那 么 我 们 可 能 要 考虑 其 他 的 压缩 方法 ， 即 使 这 意味 着 我 们 不 能 获得 一 种 理想 
的 编码 。 当 然 ， 如 果 能 够 避免 对 输入 消息 进行 两 次 遍历 ， 那 么 就 可 以 获得 可 观 的 速度 。 这 
就 是 下 面 要 介绍 的 字典 方法 。 
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Jacob Ziv 和 Abraham Lempel 率先 推出 了 在 读 取信 息 和 写 入 编码 字 节 的 过 程 中 构建 一 部 
字典 的 思想 。 基 于 字典 算法 的 输出 内 容 既 包含 文字 信息 ， 又 包含 先前 已 经 存放 字典 中 的 信 
息 指针 。 如 果 在 数据 中 存在 大 量 的 局 部 宛 余 ， 例如 一 长 串 的 空格 或 数字 0， 那么 这 种 基于 
字典 的 压缩 技术 的 效果 会 特别 好 。 尽 管 我 们 称 之 为 LZ 字典 系统 ， 但 是 如 果 要 使 用 全 名 ， 
则 “Ziv-Lempel” 会 比 “Lempel-Ziv” 更 好 一 些 。 

Ziv 和 Lempel 在 1977 年 发 表 了 他 们 的 第 一 个 算法 ， 这 个 算法 称 为 LZ77 压缩 算法 。 
L277 压缩 算法 采用 一 个 文本 窗口 和 一 个 前 视 缓冲 器 。 前 视 缓冲 器 包含 需要 编码 的 内 容 ， 文 
本 窗口 则 作为 字典 。 如 果 前 视 缓冲 器 中 的 任意 字符 都 可 以 在 字典 中 找到 的 话 ， 那 么 在 窗口 
中 文本 内 容 的 位 置 和 长 度 都 会 写 到 算法 的 输出 中 。 如 果 在 字典 中 没有 找到 所 需 的 文本 内 
容 ， 那 么 在 写 这 个 没有 编码 符号 时 会 设置 一 个 标志 ， 指示 这 个 符号 应 该 作为 文字 。 

现在 有 许多 不 同类 型 的 L277 压缩 方法 ,但 是 所 有 的 L277 压缩 方法 都 是 基于 同一 种 思 
想 的 。 下 面 通过 另外 一 个 童谣 来 解释 这 一 基本 思想 。 为 了 清晰 起 见 ， 我 们 用 下 划 线 来 取代 
童谣 中 的 所 有 空格 : 

- STAR_LIGHT _STAR_BRIGHT _ 

FIRST_ STAR_I SEE_TONIGHT _ 

LWISH I MAY I WISH I MIGHT_ 

GET_THE_WISH_I_WISH_TONIGHT 

为 了 说 明 问 题 ， 我 们 将 使 用 32 字 节 的 文本 窗口 和 16 字 节 的 前 视 缓冲 器 。( 实 际 上 ， 这 
两 个 部 分 通常 相差 几 千 个 字 节 。) 首 先 将 上 面 的 文本 读 入 到 前 视 缓冲 器 中 。 但 是 文本 窗口 中 
还 没有 任何 内 容 ， 现 在 把 符号 S 放 进 文本 窗口 ， 三 元 组 的 组 成 是 : 

1. 在 文本 窗口 中 匹配 相对 于 文本 的 偏 移 量 

2. 已 匹配 的 字符 串 长 度 

3. 前 视 缓 冲 器 中 紧 跟 匹配 短语 后 面 的 第 一 个 符号 

字符 0 


y 文本 窗口 前 视 缓冲 器 


0,0,S” 所 一 一 一 一 一 一 输出 


在 上 例 中 ， 因 为 在 文本 窗口 没有 匹配 的 内 容 ， 所 以 偏 移 量 和 字符 串 的 长 度 都 是 0。 前 视 组 
冲 器 中 的 下 一 个 字符 也 没有 相 匹配 的 内 容 ， 因 此 它 也 将 作为 二 个 索引 和 长 度 都 是 0 的 文字 


本 
0.0.S 0,0,T 


继续 写 文字 ， 直 到 了 作为 第 一 个 字符 出 现在 前 视 缓 冲 器 中 。 这 个 了 与 文本 窗口 中 位 置 
1 上 的 了 工 相 匹配 。 在 前 视 缓冲 器 中 紧 跟 在 字符 了 后 面 的 字符 是 下 划 线 ， 它 就 是 要 写 到 输出 
三 元 组 中 的 第 三 项 。 


STAR_LIGH T_STAR BRIGHT FI 


0,0,L 0.0I 0,0,G 0,0,H 1,1,_ 
0,0,S 00T 0,0,A 0,0,R 0,0,_ 


现在 ， 前 视 缓冲 器 向 前 移 位 了 两 个 字符 。STAR_ 已 经 成 了 前 视 缓冲 器 的 开始 部 分 。 它 
与 文本 窗口 中 第 一 个 字符 位 置 ( 位 置 0) 相 匹配 。 于 是 ,我 们 写 下 0、5、B， 因 为 B 是 前 视 





缓冲 器 中 紧 跟 在 STAR_ 后 面 的 第 一 个 字符 。 


0,5,B 


00L 0.01I 0,0,G 00H 1,1,. 
0,0,8 0,0,T 0,0,A 0,0,R 00， 
我 们 将 前 视 缓冲 器 中 的 字符 向 前 移 位 6 次 ， 然后 查找 字符 R 的 匹配 。 在 文本 位 置 3 中 
槐 到 吨 虹 和 


STAR LIGHT STAR B RIGHT FIRST STAR 
O05,B = 3,.l 


0;0,5 .0,0,I 0,0,G 0.0.H 1,1,A 
0,0,S 0,0,T 0,0,A 0,0,R 0.0， 


现在 ，GHT 成 了 前 视 缓 冲 器 的 开始 部 分 。 它 与 文本 中 第 七 个 位 置 开 始 的 4 个 字符 相 匹 
配 ， 我 们 再 号 入 7、 4、F。 


STAR LIGHT STAR BRI GHT_FIRST STAR I 


0,5,B 3,1,I 74,F 
0,0,L 0.0.I 0,0,G 0,0,H 1,1,A 
0,0,S 0,0,T 0,0,A 0,0,R 0.0， 


再 经 过 几 次 迭代 以 后 ,文本 窗口 几乎 全 满 了 : 


OSB IP 6b R02 
0,0,L 0,0,I 0,0,G 0,0,H 1,1,A 
0,0,S ,00T 00A 0,0,R 0,0,. 


在 将 STAR_ 和 文本 中 位 置 0 处 字符 串 相 匹配 后 ，STAR_I 这 6 个 字符 就 会 移出 缓冲 器 ， 
并 进入 文本 窗口 。 为 了 能 够 容纳 这 6 个 字符 ， 在 处 理 完 STAR_ 后 ， 文 本 窗口 必须 要 右 移 3 


个 字符 。 
STAR LIGHT STAR BRIGHT FIRST STAR I SEE TONIG 
0,5,I 


OB 3, Ll Th4F 6bR 02 
0,0,L 0,0,T “0,0,G 0,0,H 1,1,A 
0,0,S 0,0,T 0,0,A 0,0,R 0,0,_ 


在 为 STAR_I 写 好 编码 ， 并 对 文本 窗口 进行 移 位 以 后 ，_S 现在 处 于 缓冲 器 的 开始 位 置 。 
这 些 字符 与 文本 中 位 置 7 处 的 字符 串 相 匹配 。 


R_ LIGHT STAR BRIGHT FIRST STAR I _SEE TONIGHT I W 


0.5I 72.E 
0.5B 3,1I TAF 6LR 0,2, 
0.0L 0.0I 0,0,G 0,0,H 1,1,A 
00S 0,0,T 0,0,A 0.0.R 00， 
按照 这 种 方式 继续 下 去 ;最 终 可 以 到 达 文 本 的 结束 处 。 算 法 要 处 理 的 最 后 一 些 字 符 是 
ICHT。 这 些 字符 与 位 置 4 处 的 文本 内 容 相 匹配 。 因 为 在 缓冲 器 中 IGHT 后 面 已 经 没有 了 其 
他 字符 ， 所 以 最 后 写 出 的 三 元 组 是 一 个 文件 字符 结束 的 标记 符号 <EOF > 。 
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_I MIGHT GET THE WISH I WISH TON IGHT 


4,4,<EOF> 
4,L,E 9,8,W 4,4,T 0,0,0 0,0,N 


0.0.S 0,0,T 0,0,A 0,0,R 0.0， 


本 例 共 有 36 个 三 元 组 写 到 输出 中 。 如 果 采 用 32 字 节 的 文本 窗口 ， 那 么 只 需 5 位 索引 
就 可 以 指示 任何 一 个 文本 字符 。 因 为 前 视 缓冲 器 的 宽度 是 16 字 节 ， 能 够 匹配 的 最 长 字符 串 
也 是 16 字 节 ， 所 以 最 多 需要 用 4 位 来 存储 这 个 字符 串 的 长 度 。 索 引 需 要 5 位 ， 字 符 串 长 度 
需要 4 位， 每 个 ASCII 字符 要 用 7 位 ， 而 每 个 三 元 组 要 求 有 16 位 或 2 字 节 。 这 个 童谣 包含 
了 103 个 字符 ， 这 些 字符 将 存储 在 磁盘 上 103 个 未 压缩 的 字 节 中 。 而 存储 压缩 消息 只 要 求 
72 字 节 ， 这 样 得 到 的 压缩 系数 为 : [1 - (72Z103) ] x100% =30% 。 

我 们 可 以 合理 地 认为 ， 如 果 增 大 文本 窗口 ， 就 会 增 大 在 文本 窗口 中 查找 与 前 视 缓冲 器 
中 字符 相 匹配 的 可 能 性 。 倒 如， 字符 串 _TONIGHT 出 现在 童谣 的 第 41 个 位 置 和 第 96 个 位 
置 上 。 在 两 次 出 现 字符 串 _TONIGHT 之 间 间 隔 为 48 个 字符 ， 如 果 使 用 一 个 有 32 个 字符 的 
文本 窗口 ， 那 么 第 一 次 出 现 的 字符 串 _TONIGHT 就 不 可 能 作为 第 二 次 出 现 的 字典 条 目 。 如 
果 将 文本 窗口 扩大 到 64 字 节 ， 那 么 第 一 次 出 现 的 _TONIGHT 就 可 以 对 第 二 次 出 现 的 _TO- 
NIGHT 进行 编码 ， 并 且 对 每 个 编码 的 三 元 组 中 只 会 增加 1 位 。 然 而， 在 本 例 中 ,一 个 扩展 
为 64 字 节 的 文本 窗口 只 会 在 输出 中 减少 两 个 三 元 组 ， 即 从 36 个 减少 到 34 个 。 因 为 这 个 扩 
大 的 文本 窗口 要 求 有 7 位 来 表示 索引 ， 所 以 每 个 三 元 组 需要 由 17 位 组 成 。 这 样 ， 这 条 压缩 
信息 总 共 占 用 了 17 x34 =578 位 或 73 字 节 。 因 此 ， 在 本 例 中 使 用 的 这 个 较 大 的 文本 窗口 ， 
实际 上 多 花费 了 几 位 。 

在 压缩 过 程 中 ， 如 果 在 文本 窗口 和 缓冲 器 之 间 没 有 找到 任何 匹配 ， 那 么 就 会 有 退化 的 
情况 发 生 。 例 如 ， 如 果 一 个 字符 串 有 36 个 字符 ， 它 由 26 个 英文 字母 和 0~9 的 数字 组 成 ， 
即 ABC…XYZ012…89， 在 这 里 没有 可 以 匹配 的 字符 。 因 此 ， 压 缩 算 法 的 输出 将 会 是 36 个 
(0,，0,?) 形 式 的 三 元 组 。 最 后 ， 以 一 个 3 倍 原 字 符 串 长 度 的 输出 结束 ， 或 者 说 压缩 长 度 扩 
大 了 200% 。 

幸运 的 是 ， 在 实际 中 很 少 发 生 像 刚才 提 到 的 这 种 情况 。 在 许多 流行 的 压缩 工具 中 ， 
LZ77 压缩 方法 有 各 种 变化 形式 ， 包 括 用 途 比 较 广 的 PKZIP 方法 。 几 个 品牌 的 磁带 和 磁盘 驱 
动 器 直接 在 磁盘 控制 电路 中 实现 了 LZ77 压缩 方法 。 这 种 压缩 过 程 以 硬件 速度 进行 ， 而 且 
对 用 户 来 说 是 完全 透明 的 。 

自从 Ziv 和 Lempel 在 1977 年 发 表 了 他 们 的 算法 以 来 ， 基 于 字典 的 压缩 方法 一 直 是 非常 
活跃 的 一 个 研究 领域 。 一 年 以 后 ， 当 他 们 发 布 第 二 个 基于 字典 的 压缩 算法 时 ，Ziv 和 Lem- 
pel 对 原来 的 工作 进行 了 很 大 的 改进 ， 第 二 种 基于 字典 的 压缩 算法 称 为 LZ78。LZ78 与 LZ77 
不 同 ， 它 取消 了 原来 文本 窗口 大 小 固定 的 限制 。 相 反 ，LZ78 创造 了 一 种 称 为 trie 的 特殊 树 
形 数据 结构 。 在 从 输入 处 读 取 数据 时 ，LZ78 会 采用 一 些 标记 符号 来 填充 这 种 树 形 结构 。 
(如 果 有 需要 ， 这 种 树 的 每 个 内 部 节点 都 有 多 个 子 节点 ) 。 与 LZ77 压缩 方法 不 同 ，LZ78 并 
不 是 将 字符 写 入 磁盘 ， 而 是 把 指针 写 入 到 树 形 结构 的 各 个 标记 符号 中 。 在 完成 消息 的 编码 
后 ，LZ78 会 将 整个 trie 写 人 磁盘 ， 而 且 在 对 该 消息 进行 译 码 前 首先 要 读 取 这 棵 树 。( 有关 
trie 的 更 多 的 信息 可 以 参阅 附录 。) 


7A.4 GIF 和 PNG 压缩 
实现 L278 数据 压缩 所 面临 的 最 大 问题 是 如 何 对 trie 的 标记 符号 进行 有 效 的 管理 。 如 果 





字典 太 大 ， 那 么 所 需 的 指针 数目 就 可 能 变 得 比 原 始 数据 还 要 多 。 现 在 已 经 找到 了 解决 这 个 
问题 的 许多 方法 ， 其 中 一 种 方法 还 引起 了 激烈 争论 和 是 否 触犯 了 法 律 的 讨论 。 

1984 年 ，Sperry 计算 机 公司 (现在 称 为 Unisys) 的 一 名 雇员 Terry Welsh 发 表 了 一 篇 论 
文 ， 论 文 描述 了 一 种 管理 L278 字典 的 有 效 算法 。 这 种 解决 方案 主要 涉及 对 trie 中 所 使 用 标 
记 符 号 的 大 小 进行 有 效 控制 ， 这 称 为 LZW 数据 压缩 。LZW 压缩 是 支持 图 形 交 换 格 式 
(GIF) 的 一 种 基本 算法 ，GIF 是 CompuServe 公司 的 工程 师 开 发 出 来 的 ， 并 且 由 万 维 网 推广 
普及 。 因 为 Welsh 发 明 的 算法 是 属于 他 在 Sperry 公司 的 工作 职责 的 一 部 分 ， 所 以 Unisys 公 
司 行使 其 权力 为 这 个 算法 申请 了 专利 。 随 后 ，Unisys 公司 就 要 求 对 每 次 使 用 GIF 的 网 络 服 
务 提供 商 或 者 广大 用 户 都 收取 少量 的 专利 使 用 费 S。LZW 不 是 专门 为 GIF 设计 的 ，LZW 同 
样 也 可 以 用 于 TIFF 图 形 格式 ， 其 他 的 一 些 压缩 程序 (包括 UNIX Compress) 以 及 各 种 类 型 的 
软件 应 用 程序 (例如 Postseript 和 PDF) 和 某 些 硬件 设备 (其 中 最 有 名 的 设备 就 是 调制 解 调 
器 ) 中。 所以，Unisys 公司 在 网 络 社区 内 没有 很 好 地 收 到 他 们 所 要 求 的 专利 使 用 费 ， 这 一 点 
并 不 会 令 人 感到 意外 ， 因 为 一 些 网 站 公开 宣布 联合 起 来 永久 抵制 GIF。Cooler 公司 率先 通过 
创造 一 些 更 好 (至 少 是 不 同 的) 的 算法 ， 巧 妙 地 避 开 了 GIF。 其 中 一 种 算法 就 是 PNG， 即 可 
移植 网 络 图 形 格式 。 

如 果 只 是 对 GIF 专利 使 用 费 的 争论 并 不 会 导致 PNG( 发 音 为 “ping”) 的 出 现 ， 但 是 这 
种 争论 无 疑 加 速 了 PNG 的 开发 进程 。 在 1995 年 短 短 几 个 月 时 间 内 ，PNG 就 从 草案 变 成 了 
大 家 所 接受 的 国际 标准 。 令 人 感到 惊讶 的 是 ， 到 2005 年 为 止 ， PNG 的 规范 只 有 两 个 小 
修订 。 

PNG 对 GIF 做 出 了 许多 方面 的 改进 ， 其 中 包括 : 

日 用户 可 选择 的 压缩 模式 ; 在 0 ~3 范围 内 的 “更 快 压缩 ”或 者 “更 好 压缩 ”。 

。 比 GIF 有 更 高 的 压缩 比 ， 通 常情 况 下 可 以 改善 5% ~25% 。 

e@ 提供 一 个 32 位 的 CRC(ISO 3309ZITU 一 142 ) 错误 检测 功能 。 

。 在 顺序 显示 模式 中 具有 较 快 的 初始 化 显示 。 

e 一 个 可 以 免费 使 用 的 公开 的 国际 标准 并 且 得 到 了 万 维 网 协会 (W3C) 和 许多 其 他 组 织 

和 商业 机 构 的 支持 。 

PNG 采用 二 级 压缩 方式 。 首 先 ， 使 用 赫 夫 野 编 码 简 化 信息 。 然 后 ， 在 完成 于 夫 曼 编码 - 
后 再 利用 一 个 32KB 的 文本 窗口 进行 LZ77 压缩 。 

GIF 具有 一 种 PNG 所 没有 的 功能 。GIF 能 够 支持 同一 个 文件 中 的 多 个 图 像 ， 这 样 可 以 
产生 动画 效果 (虽然 比较 呆板 )。 为 了 克服 这 种 限制 ， 互 联网 协会 提出 了 多 图 像 网 络 图 形 
(MNG， 发 音 为 “ming”) 算 法 。MNG 是 PNG 的 扩展 ， 它 允许 把 多 个 图 像 压 缩 到 一 个 文件 
中 。 这 些 文件 可 以 是 任意 类 型 的 文件 ， 比 如 可 以 是 灰 度 图 像 文件 、 真 彩色 图 像 文件 、 甚 至 
是 JPEG 文件 (参见 下 一 部 分 的 内 容 )。MNG 的 1.0 版 本 在 2001 年 1 月 发 布 ， 后 来 不 断 地 进 
行 了 修改 和 功能 增强 。PNG 和 MNG 压缩 工具 在 因特网 上 都 可 以 免费 使 用 (包括 源 代码 )。 
因此 ， 我 们 可 以 合理 地 认为 握 弃 GIF 压缩 方法 只 是 一 个 时 间 问 题 。 


7A.5 JPEG 压缩 


在 我 们 欣赏 一 个 图 形 图 像 时 (例如 打印 出 来 或 在 计算 机 屏 蓝 上 显示 的 一 张 照片 )， 真 正 
看 到 的 是 由 许多 称 为 像素 或 图 片 元 素 的 圆 点 组 成 的 集合 。 这 些 像素 点 在 图 像 质量 差 的 介质 





加 美国 的 GIF 专利 在 2003 年 到 期 。 
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〈 例 如 报纸 或 连环 画 ) 中 ， 看 起 来 特别 明显 。 当 像素 点 很 小 ， 而 且 紧密 聚集 在 一 起 时 ， 我 们 的 
眼睛 就 会 感觉 到 一 个 高 品质 的 图 像 。 作 为 一 种 主观 的 量度 标准 , “高 品质 ”的 定义 大 约 是 从 
300 像素 /in( 或 者 120 像素 /em) 开始 的 。 而 在 高 端 应 用 中 ， 大 多 数 人 都 同意 对 于 一 个 1600 像 
素 /in( 或 者 640 像素 /cm) 的 图 像 ， 如 果 不 能 被 认为 是 一 幅 最 佳 的 图 像 ， 也 应 该 是 一 幅 好 图 像 。 

像素 包含 图 像 的 二 进 制 编码 ， 显 示 器 和 打印 机 的 硬件 能 够 对 这 种 形式 的 编码 进行 译 
码 。 可 以 采用 任意 数目 的 二 进 制 位 对 图 形 的 像素 进行 编码 。 例 如 ， 如 果 我 们 要 画 一 幅 黑 白 
素描 画 ; 那么 可 以 采用 每 个 像素 占用 一 位 的 编码 方式 。 这 个 像素 位 要 么 是 黑色 的 (像素 = 
0)， 要 么 是 白色 的 (像素 =1)。 如 果 我 们 决定 要 画 一 幅 有 灰 度 的 图 像 ， 那 就 需要 考虑 使 用 
多 少 种 色调 的 灰 度 才能 满足 要 求 。 如 果 要 求 为 8 种 色调 的 灰 度 ， 那 么 每 个 像素 就 需要 使 用 
3 个 二 进 制 位 。000 代表 黑色 、111 代表 白色 。 在 000 和 111 之 间 的 任何 数 都 代表 某 种 色调 
的 灰 度 等 级 。 

彩色 像素 是 由 红 、 绿 、 蓝 3 种 颜色 分 量 组 成 的 。 如 果 想 采用 8 种 不 同色 调 的 红色 、 绿 色 
和 蓝 色 对 一 个 图 像 着 色 ， 那 么 每 种 颜色 分 量 都 需要 使 用 3 位 二 进 制 数 。 因 此 ， 每 个 像素 就 需 
用 9 位， 可 以 产生 2 = 工种 不 同 的 颜色 。 黑 色 仍 旧 采 用 全 0 来 表示 ， 即 R=000、G=000、B = 
000; 白色 也 仍旧 采用 全 1 来 表示 ， 即 R=111、G=111、B=111;“ 纯 ”绿色 为 R=000、G= 
111、B=000。R=011、G =000、B =101 则 给 出 了 某 种 色调 的 紫色 ; R=111、G=111、.B= 
000 就 产生 了 黄色 。 每 种 颜色 使 用 的 位 数 越 多 ， 就 越 接近 我 们 周围 看 到 的 “ 真 彩色 ”。 大 多 数 
的 计算 机 系统 对 每 种 颜色 都 使 用 8 位 三 进 制 数 ， 可 以 表现 256 种 不 同 的 色调 ， 所 以 构建 的 色 
彩 都 近似 于 真 彩 色 。24 位 的 像素 可 以 显示 大 约 1600 万 种 不 同 的 颜色 。 

如 果 我 们 希望 以 某 种 方式 存储 一 张 4in x6in(10cm x15cm) 的 照片 图 像 ， 并 且 希 望 在 以 
后 打印 或 预览 这 个 图 像 时 ， 可 以 获得 较 好 的 图 像 质量 。 如 果 按 照 300 像素 / 襄 的 标准 ， 每 个 
像素 占用 24 位 (3 个 字 节 )， 存 储 这 幅 图 像 就 需要 300 x300 x6 x4x3 =6.48MB 存储 空间 。 
这 张 4in x6in 的 照片 可 能 只 是 张贴 在 网 络 上 某 个 销售 广告 的 一 部 分 内 容 。 可 以 想象 ， 如 果 
一 些 使 用 调制 解 调 器 拨号 上 网 的 客户 用 了 20 多 分 钟 的 时 间 还 没有 下 载 完 广告 页 ， 那 么 我 们 
将 很 可 能 失去 这 些 客 户 。 如 果 使 用 每 英寸 1600 像素 的 图 像 精 度 ， 那么 存储 空间 将 需要 近 
1. 5GB， 这 意味 着 要 下 载 和 存储 这 些 图 像 文件 实际 上 是 不 可 能 的 。 

JPEG 就 是 一 个 专门 设计 用 来 解决 这 个 问题 的 压缩 算法 。 值 得 庆幸 的 是 ， 一 般 照 片 图 像 
包含 大 量 的 元 余 信息 。 而且， 茶 些 理论 上 具有 高 粹 值 的 信息 常常 对 图 像 的 完整 性 并 不 重 
要 。 考 虑 到 这 些 因 素 ,ISO 和 ITU 联合 组 成 了 一 个 图 像 专家 联合 组 (JPEG， 读 音 为 ”jay_ 
peg”) 来 制定 一 个 国际 图 像 压缩 标准 。 第 一 个 JPEG 标准 10928 一 1 ， 于 1992 年 发 布 。 从 
1997 年 开始 对 这 个 标准 进行 重大 修改 和 扩充 。 现 在 ,新 的 标准 称 为 JPEG2000， 它 于 2000 
年 12 月 定稿 完成 。 

JPEG 是 一 组 算法 的 集合 ， 它 能 够 提供 优异 的 压缩 效果 ， 其 代价 是 会 损失 一 些 图 像 信 
息 。 直 到 目前 为 止 ， 我 们 所 介绍 的 都 是 无 损 数 据 压 缩 。 压 缩 后 存储 的 数据 与 压缩 前 的 数据 
是 完全 一 样 的 ， 除 非 由 于 计算 或 介质 错误 带 来 的 损失 。 有 时 ， 如 果 可 以 允许 有 少量 信息 损 
失 的 话 ， 那 么 可 以 实现 更 好 的 图 像 压 缩 效 果 。 照 片 图 像 特别 适合 于 有 损 数据 压缩 ， 原 因 是 
人 类 的 眼睛 具有 补偿 校正 图 形 图 像 中 出 现 少许 失真 的 能 力 。 当 然 ， 一些 图 像 携带 真实 的 信 
息 ， 只 有 在 对 图 像 的 “质量 ”进行 仔细 界定 之 后 ， 才 可 以 对 图 像 进行 有 损 数据 压缩 。 医 学 
诊断 图 像 (例如 X 义 光照 片 和 心电图 ) 就 是 此 类 图 像 。 但是， 家 庭 影 集 和 销售 宣传 册 上 的 昭 
片 ， 都 是 允许 损失 一 些 “ 信 息 ” 的 图 像 。 即 使 这 些 信 息 丢 失 后 ， 人 们 仍旧 可 以 对 其 保留 视 
觉 “质量 ”错觉 。 





JPEG 最 突出 的 一 个 特点 就 是 ， 用 户 可 以 通过 在 压缩 图 像 之 前 提供 有 关 参 数 来 控制 信息 
损失 的 数量 。 即 使 是 要 求 有 100% 的 图 像 保 真 度 ，JPEG 也 能 够 产生 非常 明显 的 压缩 效果 。 
在 图 像 保 真 度 为 75% 时 ，JEPG 压缩 过 程 所 损失 的 信息 几乎 是 难以 察觉 的 ， 而 压缩 后 的 图 
像 文 件 的 尺寸 只 有 原始 文件 大 小 的 一 小 部 分 。 图 7A-4 展示 了 采用 不 同 的 质量 参数 压缩 一 
个 灰 度 图 像 后 的 效果 图 。( 图 像 压 缩 前 原始 文件 为 一 个 7. 14KB 的 位 图 ,这 个 位 图 用 作 在 不 
同 质量 参数 条 件 下 的 输入 文件 。) 

正如 大 家 所 看 到 的 ， 只 有 当 使 用 最 
低 的 质量 因子 时 ，JPEG 压缩 所 造成 的 信 
息 损 失 才 成 为 明显 的 问题 。 大 家 同样 也 会 
注意 到 ， 在 最 高 压缩 条 件 下 ， 图 像 会 呈现 要 
出 类 似 于 纵横 拼 字 迷 的 模糊 外 观 。 如 果 理 a) 100% (5.33KB) b)75%(1.96KB)  ¢) 50% (1.49KB) 


解 了 JPEG 的 工作 原理 ， 那 么 造成 上 面 这 
Se z 


种 情况 的 原因 就 会 变 得 非常 清楚 。 
d) 25%(LIIKB) ， e) 5% (639B) f) 1% (556B 






在 对 彩色 图 像 进行 压缩 时 ，JPEC 首 广 塌 站 
先 要 将 RGB 分 量 转化 成 亮度 和 色 度 两 个 ANY 
分 量 。 亮 度 是 色彩 的 明亮 程度 ， 而 色 度 
是 色彩 本 身 的 鲜艳 程度 -人 们 的 眼睛 对 
色 度 没有 对 亮度 敏感 。 因 此 ， 在 构建 结 图 7A-4 在 一 个 7. 14KB 的 位 图 文件 上 使 用 
果 编码 时 ， 在 随后 的 压缩 步骤 中 亮度 分 不 同 量化 等 级 的 JPEC 压缩 效果 
量 应 该 尽量 不 要 有 信息 丢失 。 而 灰 度 分 量 就 不 需要 这 样 了 。 

接 下 来 ， 将 图 像 划 分 成 每 边 都 有 8 个 像素 的 许多 正方 形 块 。 然 后 ， 利 用 一 个 离散 余弦 
变换 (DCT) ， 将 这 些 64 像素 方块 从 时 域 (x*，y) 转换 到 频 域 (i, j) : 


和 和) 二 了 CU X DY Ppixel(s,)) x cos[ 他] > | 


其 中 





和 
pe 全 如 果 a = 0 

1 ”其 他 

这 种 转换 输出 的 是 一 个 8 x8 的 整 型 矩阵 ， 变 化 范围 为 -1024~1023。 其 中 ， 位 于 i= 
0, 7=0 处 的 像素 称 为 DC 系数 ， 而 且 这 个 系数 包含 原始 块 中 64 像素 的 加 权 平 均值 。 其 他 
的 63 个 值 称 为 AC 系数 。 由 于 余弦 函数 的 特性 为 cos0 =1， 因 此 变换 结果 的 频 域 矩 阵 (i, ]) 
在 右 下 角 聚 集 的 是 一 些 值 较 小 的 数字 和 0。 而 大 数 集中 在 矩阵 的 左上 角 位 置 。 矩阵 的 这 种 
模式 对 于 许多 不 同 的 压缩 方法 非常 有 利 ， 但 是 目前 还 不 准备 介绍 这 些 内 容 。 

在 对 频 域 矩阵 进行 压缩 之 前 ， 首 先 将 挎 阵 中 的 每 个 值 除 以 一 个 量化 矩阵 中 对 应 的 元 
素 。 量 化 过 程 的 目的 是 把 DCT 的 11 位 输出 减少 到 8 位 。 在 JPEG 中 ， 这 个 步骤 会 造成 信息 
损失 ， 这 种 损失 程度 可 以 由 用 户 选 择 。JPEG 规范 提供 了 儿 个 量化 矩阵 ， 用 户 可 以 根据 自己 
的 判断 使 用 其 中 的 任何 一 个 和 矩阵。 所 有 的 这 些 标 准 托 阵 都 可 保证 频 域 矩阵 中 的 元 素 包 含 最 
多 的 信息 (指向 左上 角 的 元 素 )， 而 且 保 证 在 量化 过 程 中 损失 尽 可 能 少 的 信息 。 

经 过 量化 后 ， 频 域 矩 阵 变 成 了 一 个 稀 朴 和 矩阵， 该 矩阵 包含 的 零 元 素 要 多 于 非 零 元 素 ， 
这 些 零 元 素 都 位 于 和 矩阵 的 右 下 角 。 因 此 ， 使 用 游程 长 度 编码 方式 可 以 对 具有 相同 值 的 大 数 
据 块 进行 压缩 。 
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游程 长 度 编码 是 一 种 非常 简单 的 压缩 方法 。 游 程 长度 编 码 不 是 采用 XXXXX 的 编码 方 
式 ， 而 是 编码 为 (5，X) ， 从 而 指示 出 和 运行 的 是 5 个 X。 如 果 存 储 的 是 (5,，X)， 而 不 是 
XXXXX， 那 么 将 会 节省 3 字 节 ， 但 是 并 不 包括 该 方法 可 能 要 求 使 用 的 任何 定 界 符 。 很 明 
显 ， 要 使 用 这 种 编码 最 有 效 的 方法 是 尽量 使 每 个 事件 都 对 齐 ， 以 便于 可 以 得 到 尽 可 能 多 的 
相连 的 0。 通 过 对 频 域 矩阵 进行 Z 字形 扫描 便 完成 了 JPFG 功能 。 这 个 扫描 的 结果 通常 是 包 
含 一 个 长 串 0 的 一 维和 矩阵 (向 量 ) 。 图 7A-5 说 明了 2Z 字形 扫描 的 工作 原理 。 


和 矩阵 输入 
矢量 输出 

[ (0,0), (0,1), (1,0), (2,0), (1,1), ; .(6,7), (76), (77) ] 
图 7A-5 一 个 JPEG 频 域 矩阵 的 Z 形 扫描 过 程 


使 用 游程 长 度 编码 方式 对 这 个 向 量 中 的 每 个 AC 系数 进行 压缩 。 如 果 有 DG 系数 ， 那 么 
就 要 将 DC 系数 编码 为 DC 系数 的 原始 值 和 前 一 块 的 DC 系数 之 间 的 算术 差 。 

然后 ， 可 以 使 用 再 夫 曼 编 码 方法 或 者 算术 编码 方法 对 游程 长 度 编 码 后 的 向 量 结 果 进 行 
进一步 的 压缩 。 赫 夫 曼 编码 是 首选 的 方法 ， 因 为 算术 算法 有 大 量 的 专利 限制 。 

图 7A-6 总 结 了 上 面 所 描述 的 JPEG 算法 的 各 个 步 又。 显然 ， 要 实现 解压 算法 只 需 将 压 
缩 过 程 的 各 个 步骤 反 转 过 来 。 
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图 7A-6 JPEG 压缩 算法 


JPEG2000 对 1997 年 颁布 的 JPEG 标准 进行 了 许多 的 改进 。JPEG2000 的 基础 算法 比 以 
前 更 加 完善 和 复杂 ， 而且 在 量化 参数 和 将 多 个 图 像 合 并 到 同一 个 JPEG 文件 中 的 处 理 方法 





具有 了 更 大 的 灵活 性 。JPEG2000 最 显著 的 特点 之 一 是 允许 用 户 定 义 兴 趣 区 域 。 兴 趣 区 域 就 
是 图 像 中 某 个 用 户 所 关注 的 重点 范围 ， 并 且 兴 趣 区 域内 的 图 像 不 会 受到 和 其 他 部 分 同等 程 
度 的 有 损 压 缩 。 例 如 ， 假 设 我 们 拍摄 一 张 某 个 朋友 站 在 湖 边 的 照片 。 我 们 可 能 会 告诉 
JPEG2000， 照 片 中 的 这 个 朋友 才 是 我 们 的 兴趣 区 域 。 因 此 ， 湖 的 背景 和 周围 的 树木 会 被 大 
幅度 地 压缩 ， 从 而 损失 一 些 清 晰 度 。 然 而 ， 这 个 朋友 的 图 像 将 清晰 地 保留 下 来 。 这 样 一 
来 ， 如 果 不 对 图 像 进行 增强 处 理 的 话 ， 图 像 的 背景 质量 会 比较 差 。 

JPEG2000 采用 了 小 波 变换 来 代替 JPEG 中 的 离散 余弦 变换 (小 波 变换 使 用 不 同 的 方 
式 对 图 像 或 信号 进行 采样 和 编码 。)JPEG2000 的 量化 过 程 使 用 的 是 一 个 正弦 函数 ， 而 不 是 早 
期 版 本 中 所 采用 的 简单 划分 。 这 些 更 加 复杂 的 算术 处 理 要 求 比 JPEG 占用 更 多 的 处 理 器 资 
源 ， 这 将 会 造成 计算 机 系统 性 能 的 显著 下 降 。 对 于 某 些 JPEG2000 组 件 算法 的 专利 权 在 法 
律 上 出 现 了 困扰 ， 因 此 许多 软件 供应 商 不 愿 将 JPEG2000 纳入 其 产品 中 。 对 于 JPEG2000 来 
说 ， 肯 定 需 要 时 间 来 实现 JPEG 的 普及 。 
7A.6 MP3 压缩 

尽管 有 许多 更 强大 的 音频 文件 压缩 算法 (如 AAC、0GG 和 WMA)， 但 普遍 使 用 和 支持 
的 是 MP3。MP3 采用 了 几 种 不 同 的 压缩 技术 以 及 一 些 人 体 生 理学 。 虽 然 许 多 其 他 人 帮助 改 
进 了 MP3 ， 但 德国 爱尔兰 根 - 纽 伦 堡 的 博士 生 Karlheinz Brandenburg 被 广泛 认为 是 MP3 的 
主要 创建 者 。1987 年 ， 该 大 学 和 弗 劳 恩 霍 夫 集成 电路 研究 所 组 建 了 一 个 联盟 ， 用 电子 电路 
实现 Brandenburg 的 理念 。 弗 劳 恩 堆 夫 协会 对 Brandenburg 工作 的 改进 随后 被 动态 图 像 专家 
组 (MPEG) 用 于 压缩 电影 的 音频 分 量 。 作 为 相关 音频 压缩 标准 中 的 一 个 MP3 被 正式 称 为 
MPEG-1 音频 层 川 或 MPEG-1 第 三 部 分 。 它 于 1993 年 被 国际 标准 化 组 织 采 用 为 ISO/IEC 
11172 一 3 一 1993。 重 要 的 是 要 注意 这 个 标准 仅 描述 压缩 方法 。 它 的 实现 一 一 编码 器 和 译 码 
器 的 电子 设计 ， 留 给 了 制造 商 。 要 想 充分 了 解 MP3 压缩 的 力量 ,我 们 必须 首先 了 解 音频 信 
号 如 何 记 录 在 数字 媒体 上 。 

声音 是 通过 某 种 方式 振动 空气 产生 的 ， 这 个 振动 最 终 被 人 耳 中 的 小 结构 所 检测 到 。 这 
些 振动 是 具有 频率 和 振幅 的 模拟 波 。 将 模拟 波 转换 为 数字 格式 的 方法 是 通过 以 指定 的 间隔 
对 模拟 波 进行 采样 来 实现 的 。 采 样 越 频 繁 ， 编 码 使 用 的 位 数 越 多 ， 声 音 越 接近 模拟 波 。 

我 们 在 图 7A-7a ~c 中 说 明了 这 一 概念 。 图 中 的 y 轴 由 8 个 值 组 成 ,这 使 得 波 的 幅 值 可 
以 使 用 3 位 进行 编码 并 调制 为 数字 信号 。 我 们 可 以 看 到 轴 没 有 进行 均匀 分 割 ， 在 区 间 的 中 
间 值 部 分 有 更 多 的 分 割 。 模 拟 波形 用 最 近 的 积分 值 进行 匹配 或 量化 。 因此 ， 我 们 得 到 更 好 
的 分 辨 率 ， 或 者 更 接近 于 大 多 数 发 声 区域 的 波形 。 这 种 将 模拟 信号 转换 为 数字 的 方式 称 为 
脉冲 编码 调制 (PCM) 。 标 准 音频 脉冲 编码 调制 在 yY 轴 上 使 用 16 位 。 

接 下 来 要 解决 的 问题 是 采样 率 。 在 图 7A-7a 中 ， 垂 直 条 表示 在 示例 波形 上 使 用 的 采样 
间隔。 很 容易 看 出 ， 大 量 的 波形 位 于 什 形 之 外 。 如 果 我 们 加 们 采样 率 ， 如 图 7A-7b 所 示 ， 
则 更 接近 波形 。 若 采样 率 翻 3 倍 ， 我 们 就 越 接近 ， 如 图 7A-7c 所 示 。 任 何 一 个 学 过 微 积分 
的 学 生 都 知道 ， 我 们 可 以 使 这 些 矩 形变 小 (通过 增加 采样 率 ) 直 到 数字 信号 和 模拟 信号 之 间 
的 差异 小 到 无 法 测量 。 然 而 ， 这 种 “完美 ”是 昂贵 的 ， 因 为 每 个 矩形 需要 2 字 节 在 PCM 中 
编码 。 在 某 些 时 候 ， 编 码 的 音频 文件 又 太 大 ， 无 法 实际 使 用 。 

在 20 世纪 70 年 代 后 期 ， 数 字 记 录 建 立 了 每 秒 44 100 个 样本 (44. 1kHz) 的 采样 率 。 在 
44. 1kHz 下 ， 使 用 实用 的 电子 电路 可 以 传送 足够 的 精度 音频 信号 。 使 用 44. 1kHz 的 采样 率 ， 
并 且 使 用 2 字 节 对 每 个 脉冲 进行 编码 ， 对 于 每 个 立体 声 通道 ， 所 得 位 率 为 44 100 个 样本 /sx 
16 位 /样本 =705 600bit/s。 因 此 标准 PCM 数字 信号 总 共 为 705-600 x2 =1.41Mbys。 因 此 ， 作 
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为 PCM 信号 呈现 的 3imin 歌曲 (立体 声 ) 会 产生 32MB 的 流 (不 对 流 进行 错误 检测 或 校正 )。 
对 于 CD 来 说 ， 文件 大 小 可 能 是 可 以 容 巩 的， 但 是 通过 数据 网 络 传输 是 完全 不 可 接受 的 6 
1988 年 ， 动 态 图 像 专家 组 在 ISO 的 主持 下 组 建 ， 以 找到 压缩 音频 和 视频 文件 的 方法 。 因 此 
出 现 了 几 个 压缩 标准 ，MP3 是 最 强大 和 和 广为人知 的 。MP3 对 于 每 个 PCM 样本 使 用 少 于 2 位 
但 可 以 产生 类 似 于 CD 立体 声 的 质量 。 我 们 的 31MB 文件 可 以 减少 1/8， 更 多 可 管理 的 文件 
大 小 约 4MB。° 





c) 每 秒 采样 率 为 3 倍 
图 7A-7 声波 采样 


在 Karlheinz Brandenburg 的 压缩 算法 中 最 精辟 的 洞察 力 是 他 利用 了 心理 声学 编码 ， 心 理 
声学 编码 利用 了 人 耳 感 觉 到 的 不 完美 方式 。 编 码 过 程 需要 识别 人 耳 不 会 察觉 和 丢弃 的 声 
音 。 因 此 ，MP3 为 有 损 压 缩 ， 但 不 会 对 未 经 培训 的 听众 有 任何 明显 的 影响 。 丢 弃 的 声音 包 
括 听 觉 感知 边缘 的 声音 和 被 其 他 声音 掩盖 (主导 ) 的 声音 。 此 外 ,声音 的 感知 浆 值 根据 频率 
以 及 音量 而 有 所 不 同 。 低频 音调 必须 高 于 高 频 声音 。 低 音量 的 低频 声音 可 以 丢弃 ， 因 为 收 
听 者 听 不 到 它们 。 

局 理 声学 编码 只 是 在 高 度 复 杂 的 MP3 压缩 过 程 中 的 一 个 部 分 ， 却 是 最 强大 的 一 部 
分 。 图 7A-8 提供 了 MP3 编码 的 高 级 描述 。 虽 然 对 这 个 过 程 的 每 个 步骤 的 详细 讨论 远 远 
超出 了 本 书 的 范围 ， 但 我 们 可 以 对 它们 进行 一 般 地 描述 。( 详 见 本 章 末 尾 提供 的 各 种 参 
考 资 料 。) 





加 ”降低 采样 率 可 以 使 MP3 文件 更 小 ， 但 音质 也 会 降低 。 数 字音 频 的 采样 率 包括 8000Hz、11 025Hz、16 000Hz、 
22 050Hz、44 100Hz、48 000Hz 和 96 000Hz。 





分 析 滤 
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快速 傅 里 叶 心理 声 改进 的 离散 
变换 学 模型 余弦 变换 













MP3 音 频 
图 7A-8 MP3 的 一 般 描述 


MP3 编码 过 程 的 输入 是 在 两 个 并 行路 径 上 调度 的 PCM 音频 流 。 在 其 中 一 个 带 通 滤波 器 
组 上 将 流 划分 为 32 个 频率 范围 ， 其 中 每 个 频率 范围 再 细 分 为 18 个 子 带 ， 从 而 通过 由 改进 
的 离散 余弦 变换 过 程 给 出 的 576 个 子 带 的 输出 。 

快速 依 里 叶 变 换 预 处 理 PCM 流 ， 以 便于 心理 声学 模型 的 分 析 。 我 们 知道 并 不 是 这 576 
个 子 带 都 是 产生 高 质量 声音 所 必需 的 ， 因 此 只 需要 处 理 它们 的 一 部 分 。 心 理 声学 模型 确定 
哪些 声音 落 在 人 类 听觉 的 范围 之 外 ， 哪 些 声 音 被 附近 频带 中 的 其 他 声音 所 掩蔽 。( 屏 蔽 阔 
值 是 频率 的 函数 : 冰 人 在 可 听见 声音 的 中 间 范 围 内 值 更 高 。) 心 理 声学 模型 随后 由 改进 的 离 
散 余弦 变换 和 量化 过 程 所 使 用 。 

改进 的 离散 余弦 变换 (MDCT) 过 程 将 心理 声学 模型 应 用 于 由 带 通 滤波 器 组 输出 的 576 
个 子 带 上 。 一 般 来 说 ， 离 散 余 弦 变 换 (DCT) 的 目的 是 以 图 像 强度 或 声音 幅度 形式 表示 的 输 - 
入 映射 到 以 余弦 函数 表示 的 频 域 。MP3 的 DCT 称 为 改进 型 DCT， 因 为 与 原始 的 DCT 算法 
不 同 ， 它 通过 一 组 重合 的 窗口 处 理 576 个 子 带 滤波 器 组 输出 。 这 种 重 秋 防止 在 编码 过 程 中 
在 窗口 边界 处 发 生 的 噪声 。 

余弦 函数 形式 的 MDCT 输出 传递 到 量化 函数 ， 该 量化 函数 将 实数 余弦 函数 映射 到 整数 域 。 
这 样 的 量化 总 会 有 数据 的 丢失 ， 如 第 2 章 所 讨论 的 那样 ， 实 数值 不 能 精确 地 映射 到 整数 域 。 
MP3 可 以 在 量化 中 每 秒 使 用 64 位 或 128 位 ，128 位 可 提供 更 好 的 分 辨 率 。 心 理 声学 模型 有 助 
于 量化 器 在 整数 域 上 找到 最 佳 拟 合 ， 从 而 减少 重要 声音 的 损失 。 取 代 固 定量 化 ， 如 在 上 面 所 
示 的 PCM 代码 的 创建 过 程 中 ，MP3 使 用 可 变 比例 因子 频带 ， 其 根据 人 耳 对 声音 的 灵敏 度 不 同 
而 量化 声音 的 不 同 部 分 。 较 小 的 灵敏 度 允 许 有 更 宽 的 比例 因子 频带 。 比 例 因 子 与 量化 声音 一 
起 使 用 赫 夫 曼 编 码 进行 压缩 ， 以 确保 声音 使 用 相同 的 比例 因子 进行 解压 缩 。 

边 信息 是 描述 MP3 元 数据 的 一 种 类 型 ， 它 描述 了 赫 夫 曼 编 码 过 程 、 比 例 因 子 频 带 以 及 对 
解码 过 程 至 关 重 要 的 其 他 信息 。 该 信息 被 压缩 并 分 别 组 成 17 或 32 字 节 的 单 声 道 或 立体 声 流 。 

最 后 一 步 是 组 装 MP3 帧 。MP3 帧 由 32 位 头 、 可 选 CRC 块 、 边 信息 、MP3 数据 有 效 载 
荷 和 可 选 的 辅助 数据 组 成 。MP3 帧 的 实际 长 度 取决 于 用 于 量化 数据 的 PCM 采样 位 率 和 比例 
Ws 
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很 容易 看 出 ， 这 种 复杂 过 程 需 要 在 硬件 中 实现 ， 以 便 能 够 实时 对 音频 进行 编码 ， 并 足 
够 快 地 对 其 进行 解码 ， 以 便 能 以 44. 1kHz 的 速率 在 原始 PCM 流 被 采样 时 泻 染 输出 。MP3 编 
码 器 、 译 码 器 ( 编 解码 器 ) 可 从 几 家 供应 商 处 廉价 购买 。 

总 之 先进 的 数学 、 精 湛 的 算法 和 数字 电路 的 结合 ， 创 造 了 MP3 的 “奇迹 ”。 通 过 为 所 
有 类 型 的 音乐 提供 便宜 的 分 销 渠 道 ， 它 改变 了 整个 音乐 行业 。 因 此 ， 一些 大 型 音乐 公司 享 
受 音乐 行业 的 霸权 时 代 已 经 结束 ， 许 多 其 他 公司 可 以 廉价 地 进入 。MP3 也 带 来 了 无 处 不 在 
的 播客 媒体 ， 使 全 球 共享 新 闻 和 和 信息。 点 击 儿 下 即 可 将 大 学 讲座 和 研讨 会 发 送 给 任何 便携 
式 播放 器 。MP3 的 数学 知识 、 算 法 和 电子 电路 确实 令 人 惊奇 。 但 更 令 人 惊奇 的 是 它们 如 何 
改变 了 我 们 的 世界 。 我 们 无 法 想象 没有 它们 的 世界 。 
7Az7= 水 结 

这 个 特别 部 分 向 你 介绍 了 信息 理论 和 数据 压缩 的 简要 调查 。 我 们 已 经 看 到 ， 压 缩 试 图 
从 数据 中 去 除 元 余 信息 ， 以 便 只 存储 其 信息 内 容 。 这 样 可 以 节省 存储 空间 ， 并 提高 存档 存 
- 储 的 数据 传输 速度 。 这 里 提出 了 几 种 流行 的 数据 压缩 方法 ; 包括 统计 赫 夫 曼 编 码 ，Ziv- 
Lempel 字典 编码 ， 以 及 因特网 、JPG、GIF 和 MP3 的 压缩 方法 。 字 典 系 统 在 一 次 遍历 时 压 
缩 数 据 ; 其 他 方法 至 少 需要 两 次 : 一 次 遍历 以 收集 要 压缩 数据 的 信息 ， 第 二 次 执行 压缩 过 
程 。 最 重要 的 是 ， 你 现在 在 每 种 类 型 的 数据 压缩 中 已 拥有 足够 的 基础 知识 ， 以 便 为 任何 特 
定 的 应 用 程序 选择 最 佳 方法 。 
扩展 阅读 

数据 压缩 的 理论 和 应 用 的 来 源 Salomon (2006 ) 、Lelewer 和 Hirschberg(1987)， 以 及 
Sayood(2012) 的 工作 。Sayood 的 工作 对 整套 MPEG 压缩 算法 提供 了 深入 的 描述 。 在 Nelson 
和 Gailly(1996) 著 作 中 可 以 找到 一 种 更 加 详细 的 处 理 方 法 ， 包 括 源 代码 。Nelson 和 Gailly 那 
种 清晰 明了 和 和 随意 的 写作 方式 ,会 使 读者 学 习 神 秘 的 数据 压缩 的 艺术 过 程 变 成 了 一 种 真正 
愉快 的 经 历 。 与 数据 压缩 相关 的 大 量 信息 也 可 以 在 网 络 上 找到 。 当 搜索 本 章 中 介绍 的 任何 
关键 的 数据 压缩 术语 时 ,任何 好 的 搜索 引擎 都 将 指向 成 百 上 千 个 链接 。 小 波 理 论 在 数据 压 
缩 和 数据 通信 和 领域 越 来 越 重要 。 如 果 想 深入 了 解 这 个 热门 的 领域 ,可 以 从 阅读 Vetterli 和 
Kovacevic( 1995 ) 的 著作 开始 。 这 本 书 还 包含 图 像 压 缩 的 详细 内 容 ， 当 然 包 括 在 JPEG 和 
JPEG 2000 中 应 用 的 小 波 理论 。 

本 节 我 们 几乎 没有 剖析 MP3 的 复杂 性 。 如 果 你 想 了 解 详细 信息 ，Sripada(2006) 的 硕士 
论文 包含 了 一 个 可 读 性 非常 强 的 流程 。Pan(1995) 和 Noll(1997 ) 的 文章 也 对 这 一 主题 进行 了 
详细 的 说 明 。 有 关 各 种 MPEG 编码 的 大 量 信息 可 以 在 http://www. mpeg. org/ MPEG/audio. html 
找到 。MP3 的 确定 历史 发 布 在 http:AHwww. mp3-history. com。 看 一 看 这 个 故事 如 何 发 展 是 非 
常 值得 的 1 
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习题 

1. 信息 理论 科学 的 创始 人 是 谁 ? 他 在 那 十 年 中 做 了 哪些 工作 ? 

2. 什么 是 信息 ， 它 与 信息 宛 余 有 关 吗 ? 

3. a) 列 出 两 种 类 型 的 统计 编码 。 
b) 列 出 统计 编码 的 优点 和 劣势 。 

4. 使 用 算术 编码 来 压缩 你 的 名 字 。 压 缩 后 还 可 以 还 原 吗 ? 

5. 计算 图 7A-4- 中 每 个 JPEG 图 像 的 压缩 因子 。 

6. 创建 一 个 赫 夫 曼 树 ， 并 为 7A.3 节 中 使 用 的 童谣 “Star Bright” 分 配 坎 夫 曼 码 。 使 用 <ws > 
作为 空格 ,而 不 是 下 划 线 。 

7. 完成 7A.3 节 说 明 的 L277 数据 压缩 算法 。 

8. 对 于 压缩 素描 画 ，JPEG 不 是 一 个 好 的 选择 ， 如 图 7A-4 所 示 。 请 说 明 原因 。 你 觉得 什么 
压缩 方法 更 好 ? 请 说 明理 由 。 

9.。a) LZ77 压缩 算法 属于 哪 种 类 型 的 数据 压缩 算法 ? 
b) 说 明 赫 夫 曼 编码 优 于 L277 的 原因 。 
c) 说 明 LZ77 优 于 赫 夫 曼 编 码 的 原因 。 
d) 总 结 哪个 方法 更 好 ? 

10. 说 明 PNG 的 一 个 功能 ， 以 此 来 说 服用 户 PNG 是 比 GIF 更 好 的 算法 。 
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8.1 引言 

在 你 的 职业 生涯 中 ,也许 遇 到 过 这 样 的 情况 ， 因 为 老板 要 求 你 使 用 的 某 个 软件 只 能 运行 在 
特定 的 系统 之 上 ， 所 以 你 不 得 不 购买 一 些 性 能 较 差 但 可 以 支持 这 类 系统 运行 的 计算 机 硬件 。 尽 
管 这 看 起 来 好 像 是 对 你 的 出 色 判 断 力 的 侮辱 ， 但 你 不 得 不 承认 在 一 个 计算 机 系统 中 软件 和 硬件 
是 同等 重要 的 。 软 件 是 用 户 了 解 系统 的 窗口 。 一 旦 软件 不 能 提供 用 户 所 期 待 的 服务 ， 那 么 不 管 
硬件 的 性 能 多 么 突出 ， 用 户 都 会 认为 整个 计算 机 系统 是 无 法 满足 需求 的 。 

第 1 章 提 到 计算 机 系统 的 组 织 结构 由 6 个 机 器 层 构成 ， 门 电路 级 之 上 的 每 个 层 都 对 位 于 其 
下 的 层次 提供 抽象 。 在 第 4 章 中 ,我 们 讨论 了 汇编 右 ， 以 及 汇编 语言 与 体系 结构 之 间 的 关系 。 
在 本 章 ， 我 们 学 习 位 于 第 三 层 的 软件 及 其 与 第 四 、 第 五 层 之 间 的 关系 。 这 三 个 层 所 涉及 的 软件 
处 于 应 用 程序 之 下 、 指 令 集 架构 之 上 ， 是 与 应 用 源 程序 进行 交互 的 软件 组 件 。 这 三 个 层次 中 的 
程序 协同 工作 以 访问 硬件 资源 ， 从 而 执行 应 用 程序 中 的 命令 。 将 计算 机 系统 看 成 是 一 个 从 应 用 
源 代 码 到 门 级 电路 的 单线 程 会 限制 我 们 对 于 计算 机 系统 的 理解 。 我 们 将 会 忽略 每 个 层次 所 提供 
的 丰富 的 服务 集 。 

虽然 在 本 书 提 及 的 计算 机 系统 模型 中 ,操作 系统 仅仅 位 于 “系统 软件 ” 层 , 但 系统 软件 
通常 还 包括 编译 器 和 其 他 一 些 工 具 ， 以 及 称 为 中 间 件 的 一 系列 复杂 程序 。 一 般 说 来 ， 中 间 件 是 
处 于 操作 系统 层 之 上 为 应 用 程序 提供 服务 的 一 系列 软件 。 回 顾 第 1 章 可 知 ， 我 们 曾经 讨论 过 位 
于 物理 模块 和 高 级 语言 及 应 用 之 间 的 语义 鸿沟 。 我 们 知道 这 种 语义 鸿沟 一 定 不 能 被 用 户 所 察 
觉 ， 而 中 间 件 正 是 这 类 提供 必要 不 可 见 的 软件 。 操 作 系 统 是 所 有 系统 软件 的 基础 ， 因 此 ， 实 质 
上 所 有 的 系统 软件 都 要 在 某 种 程度 上 与 操作 系统 进行 交互 。 下 面 我 们 首先 对 操作 系统 的 内 部 工 
作 原 理 进行 简要 介绍 ， 然 后 ， 再 进一步 讨论 更 高 的 软件 层 。 


8.2 操作 系统 


早期 操作 系统 的 主要 功能 是 协助 各 类 应 用 程序 与 计算 机 硬件 资源 进行 信息 交互 。 操 作 系 统 
可 以 提供 一 组 必要 的 功能 以 允许 软件 包 控制 计算 机 硬件 。 如 果 没 有 操作 系统 ， 则 每 个 应 用 程序 
都 必须 自己 有 一 套 视频 卡 、 声 卡 、 便 盘 等 硬件 设备 的 驱动 程序 集 。 

虽然 现代 操作 系统 仍然 支持 上 述 功能 ， 但 用 户 对 于 操作 系统 的 期 望 发 生 了 重大 的 改变 。 例 
如 ， 他 们 和 希望 操作 系统 更 加 易 用 ， 以 便于 管理 系统 和 资源 。 这 便 催 生 了 “ 拖 放 式 ”文件 管理 
以 及 “ 即 插 即 用 式 ” 设 备 管 理 等 功能 。 从 程序 员 的 角度 看 ， 操 作 系 统 屏 项 了 系统 底层 的 细节 ， 
使 其 更 加 专注 于 上 层 问 题 的 求解 (应 用 开发 ) 。 我 们 已 经 知道 采用 机 咒语 言 和 汇编 语言 进行 程 
序 设 计 是 十 分 困难 的 。 操 作 系统 与 众多 软件 组 件 协同 工作 ， 构 建 了 一 个 友好 的 用 户 环境 ， 在 这 
个 环境 中 系统 资源 可 以 被 更 加 有 效 和 高 效 地 利用 ， 因 此 用 户 不 再 需要 使 用 机 器 级 语言 进行 程序 
设计 了 。 操 作 系统 不 仅 为 程序 员 提 供 了 接口 ， 而 且 还 起 到 了 连接 应 用 软件 和 机 器 硬件 资源 的 作 
用 。 无 论 是 从 使 用 者 的 角度 看 还 是 从 程序 员 的 角度 看 ， 操 作 系统 本 质 上 都 是 一 个 可 以 提供 软 硬 
件 交互 接口 的 虚拟 机 。 操 作 系 统 负责 管理 各 种 设备 和 硬件 资源 ， 而 应 用 程序 和 终端 用 户 不 需要 
关心 这 些 底 层 细节 。 
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操作 系统 本 身 几乎 与 普通 软件 没有 差别 。 其 主要 区 别 在 于 操作 系统 在 开机 时 被 加 载 ， 并 直 
接 运 行 在 处 理 器 之 上 。 操 作 系统 必须 能 够 控制 处 理 器 (以 及 其 他 资源 ) ， 因 为 操作 系统 的 主要 
任务 之 一 就 是 调度 使 用 CPU 的 进程 。 此 外 ， 在 应 用 程序 执行 期 间 ， 操 作 系统 会 将 对 CPU 的 控 
制 权 转交 给 应 用 程序 。 当 应 用 程序 不 再 需要 CPU 或 因为 等 待 其 他 硬件 资源 而 放弃 CPU 时 ， 操 
作 系 统 将 重新 获得 处 理 器 的 控制 权 。 

正如 我 们 已 经 提 到 的 ， 操 作 系统 是 用 户 和 应 用 程序 访问 底层 硬件 的 重要 接口 。 除 了 作为 接 
口 之 外 ， 操 作 系统 还 有 3 个 主要 任务 。 其 中 ， 进 程 管理 是 三 者 中 最 引 人 关 注 的 。 其 他 两 个 任务 
是 系统 资源 管理 和 保护 资源 免 受 恶意 进程 的 攻击 。 在 讨论 这 些 任 务 之 前 ， 我 们 首先 简要 回顾 一 
下 操作 系统 的 发 展 史 及 其 如 何 伴随 计算 机 硬件 的 发 展 而 同步 变化 的 。 


8.2.1 操作 系统 的 历史 

当今 操作 系统 的 设计 一 直 都 在 谋求 提高 易 用 性 ， 并 提供 大 量 图 形 化 工具 以 辅助 新 手 或 有 经 
验 的 用 户 进行 操作 。 但 操作 系统 设计 的 初衷 并 非 如 此 。 在 很 早 之 前 ， 各 种 计算 机 资源 都 十 分 宝 
贵 ， 以 至 于 在 每 个 机 器 周期 内 计算 机 都 必须 进行 有 用 的 计算 。 同 时 ， 由 于 计算 机 硬件 十 分 昂 
贵 ， 因 此 计算 机 的 使 用 时 间 也 必须 精心 分 配 。 在 那个 时 代 ， 你 如 果 想 使 用 计算 机 ， 第 一 步 就 是 
要 注册 使 用 机 絮 的 时 间 。 当 轮 到 你 使 用 机 器 时 ， 你 需要 将 一 大 把 已 打 好 和 孔 的 卡片 输入 计算 机 ， 
并 在 单 用 户 交互 模式 下 运行 这 台 机 器 。 然 而 ， 在 加 载 打 孔 程序 之 前 ， 你 首先 需要 加 载 一 个 编译 
器 。 初 始 的 几 张 打 孔 卡片 相当 于 引导 程序 ， 用 于 加 载 后 续 的 卡片 (用 户 程序 ) 。 然 后 ， 你 就 可 
以 编译 程序 了 。 如 果 你 的 程序 出 现 了 错误 ， 那 么 你 必须 迅速 定位 错误 ， 然 后 重新 打 孔 令 人 厌恶 
的 卡片 ， 并 再 次 输入 计算 机 并 重新 编译 。 如 果 你 无 法 快速 找到 错误 ， 那 么 你 就 不 得 不 再 申请 新 
的 计算 机 使 用 时 间 ， 晚 些 时 候 再 次 尝试 。 如 果 编 译 成 功 ， 下 一 步 就 是 将 你 的 目标 代码 和 库 代码 
进行 链接 以 生成 可 执行 文件 并 运行 。 由 此 可 见 ， 上 述 过 程 是 对 计算 机 以 及 使 用 者 时 间 的 极度 浪 
费 。 为 了 能 够 让 计算 机 硬件 资源 被 更 多 人 高 效 使 用 ， 批 处 理 的 概念 被 引入 了 计算 机 中 。 

批 处 理 指 的 是 专业 操作 者 可 以 通过 专门 指令 将 几 摆 打 孔 卡片 打包 成 一 组 ， 使 得 这 些 卡 片 可 
以 在 最 少 的 人 工 干预 下 处 理 完 成 。 这 一 组 卡片 通常 是 相似 类 型 的 程序 。 例 如 ， 可 能 有 一 组 For- 
tran 程序 和 一 组 COBOL 程序 ， 操 作者 可 以 首先 为 Fortran 程序 设置 机 器 ， 然 后 读 人 它们 并 运行 
完毕 ， 再 修改 机 器 配置 去 运行 COBOL 程序 。 一 个 名 为 常 驻 监控 程序 的 程序 允许 程序 在 没有 人 
为 干预 的 情况 下 处 理 ( 用 户 只 需 将 几 摆 打 孔 卡片 放 入 卡片 读 取 器 中 ) 。 

这 个 监控 程序 就 是 现代 操作 系统 的 原型 。 它 的 功能 十 分 简单 。 监 控 程 序 启 动 批 处 理 作业 ， 
并 将 计算 机 的 控制 权 交 给 它 ， 当 作业 运行 完成 后 ， 监 控 程 序 将 重新 获得 计算 机 的 控制 权 。 原 来 
需要 由 人 完成 的 工作 可 以 由 计算 机 完成 ， 因 此 ， 计 算 机 的 工作 效率 和 利用 率 都 大 幅 增加 了 。 然 
而 ， 批 处 理 程序 之 间 的 转换 时 间 是 十 分 漫长 的 。( 回想 在 数据 中 心 放 下 一 扎 操 要 处 理 的 汇编 语 
言 打 孔 卡片 的 美好 旧时 光 。 如 果 可 以 在 24 小 时 之 内 得 到 计算 结果 ， 我 们 是 何等 兴奋 !) 批 处 理 
使 得 程序 调试 变 得 更 加 困难 ， 更 准确 地 说 是 更 加 费时 。 程 序 中 的 一 个 死 循 环 可 能 造成 系统 严重 
破坏 。 为 了 解决 这 个 问题 ， 一 些 定时 器 添加 进 监 控 程 序 以 避免 一 个 批 处 理 程序 独占 系统 。 然 
而 ， 由 于 监控 程序 不 能 提供 保护 功能 ， 因 此 它 的 使 用 具有 很 大 的 局 限 性 。 在 没有 保护 的 情况 
下 , 一 组 批 处 理 作业 的 运行 可 能 会 对 后 续 的 程序 造成 影响 。( 例 如 ， 一 个 不 好 的 批 处 理 作业 可 
以 读 好 多 张 卡 片 ， 从 而 使 下 一 个 程序 不 能 正常 运行 。) 此外， 批 处 理 程序 甚至 还 会 对 监控 程序 造 
成 影响 。 为 了 解决 这 个 问题 ,一 个 专门 的 硬件 加 入 了 计算 机 系统 中 ,通过 它 可 以 使 计算 机 运行 
在 监控 模式 或 用 户 模式 。 一 般 程 序 通常 运行 在 用 户 模 式 ， 当 需要 进行 系统 调用 时 计算 机 才 切 换 
到 监控 模式 。 

随 着 CPU 性 能 的 提升 ， 打 和 孔 卡 片 的 批 处 理 效 率 越 来 越 低 。 读 卡 器 的 输入 速度 已 无 法 跟 上 
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CPU 的 处 理 速 度 。 这 时 ， 磁 带 提 供 了 一 种 更 高 速 的 处 理 方式 。 读 卡 器 和 打印 机 连接 到 一 些 更 小 
的 计算 机 上 ， 这些 计算 机 将 打 孔 卡片 上 的 信息 读 入 磁带 。 一 条 磁带 可 能 包含 几 个 批 处 理 程序 。 
这 样 ， 大 型 计算 机 上 的 CPU 就 可 以 在 不 读 取 打 孔 卡 片 信息 的 情况 下 在 多 个 批 处 理 程 序 之 间 进 
行 切 换 。 同 样 ， 在 输出 时 也 可 以 采用 这 样 的 过 程 。 输 出 就 是 写 磁带 ， 这 一 过 程 也 可 以 从 大 型 计 
算 机 转移 到 连接 打印 设备 的 小 型 计算 机 上 。 监 控 程 序 则 有 必要 周期 性 地 检测 是 否 出 现 VO 操作 
请 求 。 为 了 处 理 简短 的 中 断 可 以 在 批 处 理 程序 中 加 入 定时 器 ， 使 得 监控 程序 能 够 在 磁带 上 执行 
LO 操作 。 这 样 ，LO 操作 和 CPU 计算 就 可 以 并 行 执行 。 这 种 在 20 世纪 60 年 代 后 期 至 70 年 代 
后 期 流行 的 技术 称 为 后 台 打 印 、 假 脱 机 或 SPOOLing， 也 可 以 看 成 多 道 程 序 的 最 简化 。 后 台 打 
印 这 个 词 已 写 人 计算 机 词典 ,但 当前 这 个 词 主 要 是 指 需 要 打印 的 内 容 在 输入 打印 机 之 前 应 先 写 
入 硬盘 。 

多 道 程序 系统 (20 世纪 60 年 代 末 提出 并 延续 至 今 ) 延伸 了 假 脱 机 和 批 处 理 的 思想 ， 使 几 个 
程序 可 以 在 内 存 中 并 发 执行 。 这 一 技术 通过 进程 间 的 循环 来 实现 ， 即 允许 每 个 程序 依次 循环 占 
用 CPU 中 一 个 特定 的 时 间 片 。 监 控 程 序 在 一 定 程 度 上 可 以 处 理 多 道 程序 。 它 可 以 启动 批 处 理 
作业 、 进 行 假 脱 机 操作 、 执 行 输入 /输出 、 实 现 用 户 间 的 切换 以 及 提供 批 处 理 作业 间 的 保护 。 
然后 ， 应 该 弄 清 楚 的 是 监控 程序 本 身 正 变 得 越 来 越 复 条， 相应 的 软件 程序 必须 更 加 精细 地 设 
计 。 此 时 ， 包 含 了 监控 程序 的 软件 就 是 我 们 所 熟知 的 操作 系统 。 

虽然 操作 系统 大 幅 降 低 了 程序 员 ( 和 操作 者 ) 的 工作 量 ， 但 用 户 仍 然 希 望 和 计算 机 进行 更 
加 密切 的 交互 。 特 别 是 ， 批 处 理 概念 已 不 再 有 吸引 力 。 假 设 用 户 能 够 以 交互 的 方式 提交 自己 的 
程序 ， 并 且 马 上 就 可 以 得 到 结果 ， 这 不 是 很 好 吗 ?” 分 时 系统 的 出 现 为 这 种 假设 提供 了 支持 。 在 
分 时 系统 中 ， 多 台 终端 机 连接 到 主 系统 上 ， 这 样 可 以 支持 多 个 用 户 对 系统 进行 并 发 的 访问 。 由 
于 交互 式 程序 使 分 时 (也 称 为 时 间 片 ) 更 为 便利 ， 因 此 批 处 理 技术 马上 就 过 时 了 。 在 分 时 系统 
中 ，CPU 在 用 户 之 间 快 速 地 切换 ,使 每 个 用 户 都 可 以 在 一 个 极 短 的 时 间 内 获得 处 理 右 的 使 用 
权 。 这 个 在 进程 间 切 换 的 过 程 称 为 上 下 文 切 换 。 操 作 系统 快速 地 执行 上 下 文 切换 ， 其 本 质 是 给 
每 个 用 户 都 提供 一 个 个 人 的 虚拟 机 。 

分 时 技术 允许 许多 用 户 共享 同一 个 CPU。 进 一 步 扩展 这 个 思想 ， 一 个 计算 机 系统 也 允许 多 
个 用 户 共享 同一 个 应 用 程序 。 像 机 票 预 订 系 统 这 样 的 大 型 交互 式 系统 可 同时 为 成 千 上 万 个 用 户 
提供 服务 。 也 正 是 由 于 存在 分 时 系统 ， 使 得 大 型 交互 式 系统 的 用 户 感 觉 不 到 其 他 用 户 也 在 使 用 
这 个 系统 。 

多 道 程序 和 分 时 技术 的 提出 使 操作 系统 的 设计 更 加 复杂 。 在 上 下 文 切 换 过 程 中 ， 所 有 与 当 
前 正在 执行 的 进程 相关 的 信息 都 必须 保存 ， 以 便 该 进程 被 再 次 调度 使 用 CPU 时 ,中断 时 的 状 
态 能 够 准确 恢复 。 这 就 要 求 操作 系统 获知 所 有 的 硬件 细节 。 在 第 6 章 中 我 们 提 到 现代 计算 机 系 
统 采用 了 虚拟 存储 器 和 分 页 管理 技术 。 因 此 ， 在 上 下 文 切 换 过 程 中 ， 必 须 保 存 页 表 及 其 他 和 虚 
拟 存储 器 相关 的 信息 。 同 样 ，CPU 内 部 寄存 器 中 的 值 在 上 下 文 切换 过 程 中 也 必须 保存 ， 这 是 因 
为 CPU 内 部 寄存 器 包含 了 当前 进程 的 执行 状态 。 上 下 文 切 换 是 一 个 既 费 时 又 消耗 资源 的 过 程 。 
为 了 使 用 上 下 文 切 换 ， 操 作 系统 必须 快速 、 高 效 地 处 理 这 一 过 程 。 

非常 有 意思 的 是 操作 系统 的 变革 总 是 与 体系 结构 的 发 展 息息相关 。 第 一 代 计算 机 使 用 电子 
管 ， 其 处 理 速度 十 分 缓慢 。 在 那个 时 候 确实 没有 必要 使 用 操作 系统 ， 因 为 那 时 的 计算 机 不 可 能 
处 理 多 个 并 发 任务 ， 人 工 完成 任务 管理 工作 即 可 。 第 二 代 计 算 机 是 基于 晶体 管 设计 的 ，CPU 的 
计算 速度 和 处 理 能 力 有 了 大 幅 提 升 。 虽 然 CPU 的 处 理 能 力 获 得 了 提高 ， 但 它 却 十 分 昂贵 ， 因 
此 必须 最 大 程度 地 加 以 利用 。 批 处 理 正 是 一 种 使 CPU 满 负载 工作 的 方法 。 监 控 程 序 辅助 批 处 
理工 作 ， 提 供 一 定 的 保护 和 中 断 处 理 机 制 。 第 三 代 计 算 机 的 标志 是 集成 电路 技术 的 使 用 ， 其 处 
理 速度 再 次 大 幅 提升 。 假 脱 机 技术 已 不 能 使 CPU 满 负 载 工作 ， 因 此 提出 了 分 时 技术 。 虚 拟 存 





储 器 和 多 道 任 务 需要 一 个 更 加 复杂 的 监控 程序 ， 这 就 催生 了 现代 操作 系统 。 第 四 代 技 术 是 超大 
规模 集成 电路 ， 使 个 人 计算 市 场 繁 沫 发 展 。 网 络 操作 系统 和 分 布 式 操作 系统 是 这 一 技术 的 产 
物 。 电 路 的 小 型 化 节省 了 芯片 面积 ， 使 得 在 芯片 上 可 以 有 更 多 的 空间 去 容纳 用 于 管理 流水 线 、 
阵列 处 理 以 及 多 处 理 的 电路 。 

早期 的 操作 系统 在 设计 上 是 多 样 化 的 。 生 产 厂商 会 根据 不 同 的 硬件 平台 设计 不 同 的 操作 系 
统 。 一 个 厂商 针对 不 同 硬件 平台 设计 的 操作 系统 在 所 提供 的 操作 和 服务 上 会 有 显著 的 不 同 。 当 
一 种 新 型 计算 机 出 现 后 ， 厂 商 必须 为 其 设计 一 个 全 新 的 操作 系统 ， 在 那个 时 代 这 种 设计 思路 是 
非常 常见 的 。 当 IBM 公司 在 20 世纪 60 年 代 中 期 推出 了 360 系列 机 后 ， 这 种 设计 思路 终结 了 。 
虽然 360 系列 中 的 每 种 计算 机 在 性 能 和 预期 用 户 上 都 有 很 大 不 同 ， 但 所 有 机 器 都 运行 03/360 
这 个 操作 系统 。 

UNIX 是 另 一 个 经 典 的 操作 系统 ， 其 证 明了 一 个 操作 系统 可 以 支持 许多 硬件 平台 的 设计 思 
路 。Ken Thompson 从 1969 年 开始 在 贝尔 实验 室 进行 UNIX 研发 工作 。Thompson 在 最 开始 的 时 
候 采 用 汇编 语言 来 编写 UNIX。 因 为 汇编 语言 是 与 具体 硬件 相关 的 ， 所 以 为 某 种 硬件 平台 编写 
的 代码 必须 经 过 大 幅 调 整 和 重新 汇编 才能 运行 在 另 一 个 硬件 平台 上 。 为 了 避免 重复 性 工作 ， 他 
创造 了 一 种 新 的 名 为 B 语言 的 解释 性 高 级 语言 。 但 后 来 证 明 B 语言 的 执行 速度 太 慢 ， 无 法 文 
持 操作 系统 的 处 理 速度 。 于 是 Dennis Ritchie 与 Thompson 合作 开发 了 C 语言 ， 并 于 1973 年 发 布 
了 第 一 个 C 语言 编译 器 。Thompson 和 Ritchie 采用 C 语言 重新 编写 了 UNIX 操作 系统 ， 这 打破 
了 操作 系统 必须 使 用 汇编 语言 进行 编写 的 传统 观念 。 因 为 UNIX 操作 系统 是 使 用 高 级 语言 编写 
的 并 可 以 被 编译 以 运行 在 不 同 硬件 平台 之 上 ， 所 以 UNIX 具有 高 度 的 可 移植 性 。 这 个 巨大 的 变 
革 使 得 UNIX 变 得 十 分 流行 ， 已 拥有 了 几 百 万 的 用 户 。UNIX 操作 系统 的 中 立 性 使 得 其 用 户 可 
以 为 他 们 的 应 用 选择 最 好 的 硬件 ， 而 不 再 受 具体 平台 的 限制 。 当 今 有 上 百 种 基于 UNIX 的 操作 
系统 ， 包 括 Sun 公司 的 Solaris 、IBM 的 AIX、 惠 普 公 司 的 HP- UX 以 及 用 于 PC 和 服务 需 的 
Linux。 

实时 、 多 处 理 器 以 及 分 布 式 / 网 络 系统 

也 许 近年 来 操作 系统 设计 者 所 面临 的 最 大 挑战 是 实时 、 多 处 理 器 以 及 分 布 式 /网 络 系统 的 
出 现 。 实 时 系统 主要 用 来 控制 生产 车 间 、 组 装 线 、 机 器 人 以 及 复杂 的 物理 系统 ， 比 如 空间 站 ， 
实时 系统 对 于 时 间 有 着 严格 的 要 求 。 如 果 不 能 满足 规定 的 时 间 ， 可 能 对 个 人 甚至 社会 财产 造成 
严重 的 破坏 或 影响 。 因 为 这 些 系统 必须 对 外 部 事件 做 出 响应 ， 所 以 正确 的 进程 调度 是 关键 。 可 
以 想象 如 果 一 个 核电 站 的 控制 系统 不 能 对 核反应 堆 内 部 的 高 温 警 报信 号 做 出 及 时 反应 ， 那 后 果 
将 是 多 么 严重 ! 在 硬 实时 系统 ( 即 响应 时 间 无 法 满足 就 可 能 造成 致命 结果 的 系统 ) 中， 不 允许 
有 任何 错误 的 发 生 。 对 于 软 实时 系统 ， 在 规定 时 间 做 出 及 时 响应 是 设计 要 求 ， 但 如 果 无 法 满 
足 ， 也 不 会 造成 灾难 性 的 结果 。QNX 是 一 个 优秀 的 实时 操作 系统 ( RTOS) 范例 ， 其 主要 用 于 满 
足 严格 的 调度 需求 。QNX 也 十 分 适合 于 和 能 人 式 系统 ， 因 为 它 功能 强大 但 占用 空间 小 (需要 很 少 
的 内 存 ) ， 同 时 安全 可 靠 。 

多 处 理 器 系统 则 表现 出 特有 的 设计 挑战 ， 因 为 存在 多 个 需要 调度 的 处 理 器 。 操 作 系统 如 何 
将 多 个 进程 分 配给 多 个 处 理 器 是 主要 考虑 的 设计 因素 。 一 般 说 来 ， 在 多 处 理 需 环境 中 ，CPU 之 
间 彼 此 协同 工作 以 解决 一 个 问题 。 处 理 器 间 的 协同 工作 要 求 它们 之 间 必 须 有 一 些 通信 方法 。 系 
统 的 同步 需要 确定 处 理 器 间 是 采用 紧 耦 合 还 是 松 耦合 的 通信 方法 。 

紧 耦 合 多 处 理 器 共享 一 个 中 央 存 储 器 ， 这 要 求 操作 系统 必须 谨慎 地 同步 进程 以 保护 信息 。 
这 种 耦合 方式 广泛 应 用 于 少 于 16 个 处 理 器 的 多 处 理 器 系统 中 。 对 称 多 处 理 器 (SMP) 是 一 种 流 
行 的 紧 耦 合体 系 结构 。 在 这 种 结构 中 ， 多 个 处 理 器 共享 存储 器 和 LO 设备 。 所 有 的 处 理 器 在 各 
自 的 数据 上 都 执行 同样 的 操作 。 
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松 耦 合 多 处 理 器 在 物理 上 拥有 分 布 式 存储 器 ， 所 以 可 认为 是 分 布 式 系统 。 分 布 式 系统 可 以 
用 两 种 不 同 的 方式 来 理解 。 一 种 是 网 络 系统 ， 即 在 一 个 局 域 网 内 分 布 着 多 个 工作 站 ， 每 个 工作 
站 运行 自己 的 操作 系统 。 网 络 系统 的 出 现 是 由 多 台 计 算 机 共享 资源 的 需求 推动 的 。 一 个 网 络 操 
作 系 统 包 含 的 功能 有 远程 命令 执行 、 远 程 文件 访问 以 及 远程 登录 (将 机 器 加 入 网 络 ) 。 用 户 进 
程 可 以 通过 网 络 和 其 他 机 器 上 的 进程 进行 通信 。 网 络 文件 系统 是 网 络 系统 的 另 一 个 重要 应 用 。 
它 允 许多 台 机 器 共享 一 个 逻辑 文件 系统 ， 即 使 这 些 机 器 可 能 分 布 在 不 同 的 地 理 位 置 ， 具有 不 同 
的 体系 结构 ， 以 及 运行 不 同 的 操作 系统 。 这 些 系 统 间 的 同步 是 一 个 重要 问题 ,但 通信 更 加 重 
要 ， 因 为 通信 距离 可 能 十 分 遥远 。 虽 然 网 络 系统 可 以 分 布 在 不 同 地 理 区 域 ， 但 它们 不 是 真正 意 
义 上 的 分 布 式 系统 。 我 们 将 在 第 9 章 更 多 地 介绍 分 布 式 系统 。 

一 个 真正 的 分 布 式 系统 与 一 个 包含 多 个 工作 站 的 网 络 的 最 大 不 同 在 于 : 一 个 分 布 式 操作 系 
统 同时 运行 在 所 有 的 机 器 上 ， 为 每 个 用 户 提供 一 个 单机 镜像 ( 即 每 个 用 户 都 好 像 在 使 用 相同 的 
机 器 ) 。 相 反 ， 在 网 络 系统 中 ,用户 会 意识 到 系统 中 有 不 同 机 器 的 存在 。 因 此 ， 在 分 布 式 系统 
中 透明 性 是 一 个 重要 问题 。 不 能 仅仅 因为 文件 分 布 在 不 同 的 机 器 上 ， 或 者 它们 为 不 同 的 机 器 提 
供 不 同 的 命令 ， 就 为 文件 分 配 不 同 的 文件 名 。 

本 质 上 ， 多 处 理 器 操作 系统 和 单 处 理 器 操作 系统 没有 明显 的 不 同 。 然 而 ， 为 了 确保 多 个 
CPU 满 负载 工作 ， 调 度 是 一 个 主要 的 不 同 点 ， 因 为 多 CPU 必须 保持 为 忙 状 态 。 如 果 调 度 机 制 
的 设计 存在 问题 ， 则 多 处 理 器 固有 的 并 行 优势 将 不 能 得 到 充分 利用 。 特 别 是 ， 如 果 操 作 系 统 不 
能 提供 合适 的 工具 以 利用 并 行 性 ， 则 机 器 性 能 将 遭受 损失 。 

正如 我 们 之 前 提 到 的 ， 实 时 系统 需要 特别 设计 的 操作 系统 。 实 时 系统 和 认 人 式 系统 要 求 操 
作 系 统 具 有 最 小 的 尺寸 和 最 小 的 资源 利用 率 。 无 线 网 络 是 戏 和 人 式 系统 和 网 络 系统 的 紧密 组 合 ， 
这 对 操作 系统 的 设计 提出 了 新 的 需求 。 

个 人 计算 机 操作 系统 

针对 个 人 计算 机 的 操作 系统 相 比 大 型 系统 有 不 同 的 设计 目标 。 大 型 操作 系统 的 作用 主要 是 
提供 出 色 的 性 能 和 硬件 利用 率 ( 仍 要 保证 系统 方便 使 用 ) ， 而 面向 个 人 计算 机 的 操作 系统 的 一 
个 主要 目标 就 是 使 系统 更 加 友好 易 用 。 

当 Intel 在 1974 年 发 布 8080 微 处 理 器 时 ,公司 要 求 Gray Kildall 编写 一 个 操作 系统 。 
Kildall 设计 了 一 个 软驱 ， 可 将 软盘 与 8080 相连 接 ， 然 后 编写 了 操作 系统 的 软件 来 控制 它 。 
Kildall 把 这 个 基于 磁盘 的 操作 系统 称 为 CP/M ( 微型 计算 机 的 控制 程序 ) 。BIOS ( 基本 的 输 
入 /输出 系统 ) 使 得 CP/M 可 运行 在 不 同类 型 的 PC 之 上 ， 因 为 BIOS 提供 了 与 输入 /输出 设备 
交互 的 必要 接口 。 因 为 /0 设备 在 不 同系 统 间 最 有 可 能 发 生变 化 ， 所 以 将 这 些 WO 设备 的 接 
口 封装 到 一 个 模块 内 ， 可 以 使 操作 系统 不 会 因为 机 器 的 不 同 而 不 同 。 针 对 不 同 机 器 仅 需要 
对 BIOS 进行 调整 即 可 。 

Intel 错误 地 认为 基于 磁盘 的 计算 机 前 景 黯 淡 。 在 决定 不 使 用 这 种 新 型 操作 系统 后 ，Intel 将 
CP/M 的 专利 权 给 予 了 Kildall。1980 年 ，IBM 需要 为 其 个 人 计算 机 设计 操作 系统 。 虽 然 IBM 首 
先 联系 了 Kildall ， 但 这 笔 交易 最 终 被 微软 获得 ， 微 软 向 西雅图 计算 机 设备 公司 支付 15 000 美元 购 
买 了 名 为 QDOS 的 基于 磁盘 的 操作 系统 。 后 来 ， 这 个 软件 被 重新 命名 为 MS-DOS， 剩 下 的 故事 
已 被 众人 所 熟知 。 

早期 面向 个 人 计算 机 的 操作 系统 通过 键盘 输入 命令 的 方式 进行 操作 。GUI( 图 形 用 户 接 口 ) 
的 发 明 者 Alan Key 和 鼠标 的 发 明 者 Doug Engelbart 同属 于 施乐 Palo Alto 研究 中 心 ， 当 将 他 们 的 
理念 融入 操作 系统 后 ， 操 作 系 统 的 面貌 焕然 一 新 。 通 过 他 们 的 努力 ,命令 提示 符 被 窗口 、 图 标 
和 下 拉 菜 单 所 取代 。 微 软 通 过 Windows 系列 操作 系统 (包括 Windows 1. x、2. x、3. x、95 、98 、 
ME、NT、2000、XP、7 以 及 8)， 推广 并 普及 了 这 一 理念 (但 不 是 微软 发 明 的 )。Macintosh 的 图 
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形 化 操作 系统 MacOS 比 Windows GUI 早出 现 几 年 ， 也 有 多 个 版 本 。UNIX 借助 Linux 和 Open- 
BSD 也 在 个 人 计算 机 世界 中 流行 开 来 。 此 外 ， 还 有 许多 其 他 基于 磁盘 的 操作 系统 ( 像 DR DOS、 
PC DOS 以 及 0S/2)， 但 它们 没有 Windows 和 UNIX 的 各 种 版 本 流行 。 


8.2.2 操作 系统 的 设计 

因为 在 计算 机 上 运行 的 最 重要 的 软件 就 是 操作 系统 ， 所 以 对 于 它 的 设计 必须 相当 谨慎 。 操 
作 系 统 控制 计算 机 的 基本 功能 ， 包 括 存 储 器 管理 和 输入 /输出 ， 更 不 必 说 那些 “看 得 见 摸 得 
着 ”的 接口 了 。 操 作 系 统 与 其 他 大 多 数 软件 的 区 别 在 于 它 是 由 事件 驱动 的 ， 意 思 是 操作 系统 所 
执行 的 任务 是 对 命令 、 应 用 程序 、LO 设备 以 及 中 断 的 响应 。 

4 种 主要 因素 影响 操作 系统 的 设计 : 性 能 、 功 耗 、 成 本 和 兼容 性 。 到 目前 为 止 ， 对 操作 系 
统 是 什么 已 经 有 了 一 些 简 单 的 认识 ， 但 是 对 于 究竟 什么 是 操作 系统 仍然 存在 很 多 不 同 的 观点 ， 
从 当前 存在 的 多 种 类 型 的 操作 系统 就 可 以 证 明 这 一 点 。 大 多 数 操作 系统 都 有 相似 的 接口 ， 但 对 
于 如 何 执行 相关 任务 则 有 很 大 的 区 别 。 有 些 操作 系统 追求 简化 设计 ， 只 实现 最 基本 的 功能 即 
可 ; 而 另 一 些 操作 系统 则 试图 涵盖 所 有 想到 的 功能 。 有 些 操作 系统 具有 出 色 的 用 户 接口 ， 但 在 
其 他 方面 的 设计 不 尽 如 人 意 ; 而 另 一 些 操作 系统 在 存储 器 管理 和 IZO 上 拥有 出 色 的 设计 ， 但 用 
户 接口 方面 则 是 其 短 板 。 没 有 一 个 操作 系统 在 所 有 方面 都 做 得 很 出 色 。 

在 操作 系统 设计 中 有 两 个 组 件 至 关 重 要 : 内 核 和 系统 程序 。 内 核 是 操作 系统 的 核心 。 它 为 
进程 管理 器 、 调 度 器 、 资 源 管 理 器 和 LO 管理 器 提供 必要 支持 。 内 核 负 责 调度 、 同 步 、 保 护 / 
安全 、 存 储 器 管理 和 中 断 处 理 。 它 主要 控制 系统 硬件 ， 包 括 中 断 、 控 制 寄 存 器 、 状 态 字 、 定 时 
器 。 它 加 载 所 有 的 设备 驱动 、 提 供 通用 的 工具 以 及 协调 所 有 LO 的 行为 。 内 核 必 须知 道 所 有 硬 
件 的 具体 细节 ， 以 便 将 它们 组 合 为 一 个 完整 系统 。 

当前 存在 两 种 截然 相反 的 内 核 设 计 方 法 ， 即 微 内 核 结构 和 宏 内 核 (也 称 单 内 核 ) 结 构 。 微 
内 核 仅 封装 一 些 操 作 系统 最 常见 的 功能 (如 进程 调度 、 存 储 器 管理 、 进 程 间 通信 等 ) ， 还 需要 
依赖 其 他 模块 来 执行 特定 的 任务 ， 因 此 ， 微 内 核 将 很 多 典型 的 操作 系统 服务 (如 驱动 程序 ) 移 
送 到 用 户 空间 。 这 种 机 制 允许 很 多 操作 系统 服务 在 不 用 重启 操作 系统 的 前 提 下 动态 地 加 载 和 配 
置 。 因 为 运行 在 用 户 级 的 服务 对 系统 资源 的 访问 受到 限制 ， 所 以 微 内 核 也 是 安全 的 。 相 比 宏 内 
核 ， 微 内 核 更 容易 定制 并 移植 到 其 他 硬件 平台 之 上 。 然 而 ， 微 内 核 必 须 与 其 他 模块 进行 额外 的 
通信 ， 这 就 导致 系统 运行 速度 慢 、 效 率 低 。 微 内 核 设 计 的 主要 特征 是 体积 更 小 ， 容 易 移植 ， 很 
多 系统 服务 运行 在 微 内 核 之 上 而 不 是 运行 在 微 内 核 之 中 。 随 着 SMP 和 其 他 多 处 理 器 系统 的 发 
展 ， 微 内 核 得 到 了 更 广泛 的 关注 。 常 见 的 基于 微 内 核 的 操作 系统 有 MINIX、Mach 和 QNX。 

宏 内 核 则 在 一 个 进程 中 提供 了 所 有 必需 的 功能 ， 即 所 有 功能 都 运行 在 内 核 空间 内 。 因 此 ， 
宏 内 核 要 远 远 大 于 微 内 核 。 因 为 宏 内 核 一 般 是 针对 特定 硬件 平台 设计 的 ， 并 直接 与 硬件 资源 进 
行 交互 ， 所 以 相 比 微 内 核 它 更 容易 优化 。 但 也 正 是 因为 这 个 原因 ， 安 内 核 不 容易 移植 。 典 型 的 
基于 宏 内 核 的 操作 系统 包括 Linux、MacOS 和 DOS。 

因为 除了 管理 之 外 ， 操 作 系 统 本 身 也 是 消耗 各 种 资源 的 ， 所 以 设计 者 必须 考虑 最 终 操作 系 
统 的 大 小 。 例 如 ， 一 个 常见 的 Linux 版 本 一 一 Ubuntu 12. 04 需要 5MB 的 硬盘 空间 ，Windows 7 
和 Windows 8 的 大 小 则 是 Ubuntu 12. 04 的 3 倍 多 。 这 些 数 据说 明了 在 过 去 20 年 间 操作 系统 的 功 
能 取得 了 爆炸 性 的 增长 。 要 知道 ，MS-D0OS 1.0 仅 需要 一 张 100KB 的 软盘 即 可 装 下 。 


8.2.3 操作 系统 的 服务 


在 之 前 关于 操作 系统 体系 结构 的 讨论 中 ， 我 们 提 到 了 一 些 由 操作 系统 提供 的 重要 服务 。 操 
作 系统 监管 所 有 关键 的 系统 管理 任务 ， 包 括 存储 器 管理 、 进 程 管理 、 保 护 机 制 以 及 和 LO 设备 
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的 交互 。 作 为 一 个 接口 角色 时 ， 操 作 系统 决定 了 用 户 如 何 和 计算 机 进行 交互 ， 就 好 像 是 一 个 位 
于 用 户 和 硬件 之 间 的 缓冲 器 。 上 述 任何 一 个 功能 都 是 决定 整个 计算 机 系统 性 能 和 可 用 性 的 重要 
因素 。 实 际 上 ， 有 些 时 候 如 果 系 统 便于 使 用 ， 即 使 牺牲 一 些 性 能 也 是 可 以 接受 的 。 在 图 形 用 户 
接口 领域 ， 这 种 折 中 设计 是 最 明显 的 。 

用 户 接口 

操作 系统 在 用 户 和 计算 机 硬件 之 间 提 供 了 一 个 抽象 层 。 因 为 操作 系统 提供 了 一 个 接口 以 隐 
藏 计算 机 的 细节 ， 所 以 用 户 和 应 用 程序 都 无 法 直接 看 到 硬件 。 操 作 系 统 提 供 了 3 种 基本 接口 ， 
每 种 接口 都 为 某 个 特定 使 用 者 提供 一 个 不 同 的 视角 。 硬 件 开 发 者 将 操作 系统 看 成 具体 硬件 的 抽 
象 接口 。 应 用 开发 者 将 操作 系统 视 为 各 种 应 用 程序 和 系统 服务 的 接口 。 一 般 用 户 则 把 操作 系统 
视 为 图 形 接口 ， 也 是 我 们 通常 所 说 的 接口 。 

操作 系统 的 用 户 接口 可 分 为 两 种 基本 类 型 : 命令 行 接口 和 图 形 用 户 接 口 (GUI) 。 命 令 行 接 
口 提供 了 一 个 带 提示 符 的 窗口 ， 用 户 可 在 其 中 输入 各 种 命令 ， 如 拷贝 文件 、 删 除 文件 、 显 示 目 
录 内 容 以 及 对 目录 结构 进行 操作 。 命 令 行 接口 往往 需要 用 户 熟悉 相关 系统 的 语法 ， 这 对 于 一 般 
用 户 而 言 过 于 复杂 。 然 而 ， 对 于 已 经 熟悉 某 种 命令 行 语法 的 用 户 来 说 ， 直 接 通 过 命令 行 执行 任 
务 会 比 使 用 图 形 接口 更 有 效 。 男 一 方面 ， 图 形 接口 为 普通 用 户 提供 了 一 个 更 加 便捷 的 接口 。 现 
代 的 图 形 用 户 接 口 由 桌面 上 的 各 种 窗口 组 成 。 这 些 窗 口 文件 通过 图 标 和 其 他 图 形 化 方式 来 表 
示 ， 并 可 通过 鼠标 对 其 进行 操作 。 常 见 的 命令 行 接口 有 UNIX shell 和 DOS。 常 见 的 图 形 接口 有 
微软 各 种 版 本 的 Windows 以 及 Mac0S。 随 着 硬件 成 本 的 降低 ， 特 别 是 处 理 器 和 内 存 成 本 的 降 
低 ， 图 形 接口 已 经 添加 到 很 多 其 他 操作 系统 中 了 。 其 中 ， 由 很 多 UNIX 操作 系统 提供 的 通用 X 
窗口 系统 最 为 常见 。 

用 户 接口 本 身 是 一 个 或 一 组 构成 显示 管理 器 的 程序 。 这 个 模块 通常 与 操作 系统 内 核 中 的 核 
心 功能 相 分 离 。 大 多 数 现代 操作 系统 都 会 创建 一 个 完整 的 操作 系统 程序 包 ， 里 面具 有 与 内 核 紧 
密 关 联 的 模块 ， 这 些 模块 包括 接口 、 文 件 处 理 和 其 他 一 些 应 用 。 这 些 模 块 彼此 链接 在 一 起 的 方 
式 是 定义 现代 操作 系统 的 一 个 主要 特征 。 

进程 管理 

进程 管理 是 操作 系统 服务 的 核心 。 它 包括 从 进程 创建 (设置 相关 数据 结构 来 保存 进程 信 
息 ) ， 到 调度 进程 的 使 用 资源 ， 再 到 删除 进程 以 及 进程 终止 后 的 清理 工作 等 。 操 作 系统 跟踪 每 
个 进程 ， 包 括 它 的 状态 (包括 变量 的 取 值 、CPU 寄存 器 中 的 内 容 和 当前 进程 状态 一 一 运行 、 就 
绪 还 是 等 待 ) 、 它 正在 使 用 的 资源 以 及 请 求 的 资源 。 操 作 系统 时 刻 关注 着 每 个 进程 的 动作 以 避 
免 可 能 出 现 的 同步 问题 ， 即 多 个 并 发 进程 访问 共享 资源 。 这 些 动 作 必须 小 心 监控 以 避免 数据 的 
不 一 致 和 偶发 的 资源 使 用 冲突 。 

在 任何 给 定 的 时 间 内 ， 内 核 都 管理 着 一 个 进程 集合 ， 这 个 集合 由 用 户 进程 和 系统 进程 组 
成 。 大 多 数 进程 是 相互 独立 的 。 然 而 ， 在 需要 交互 以 实现 一 个 共同 目标 时 ， 它 们 依靠 操作 系统 
实现 进程 间 的 通信 任务 。 

进程 调度 是 操作 系统 的 一 个 重要 组 成 部 分 。 首 先 ， 操作 系 统 必须 决定 哪 一 个 进程 可 以 进入 
系统 (通常 称 为 长 期 调度 ) 。 然 后 ， 操 作 系 统 在 某 一 特定 时 刻 还 必须 决定 哪个 进程 可 以 获得 
CPU 的 使 用 权 ( 短期 调度 ) 。 为 了 支持 短期 调度 ， 操 作 系 统 维持 一 个 就 绪 进程 列表 ， 因 此 ， 操 
作 系 统 可 以 区 分 哪些 进程 正在 等 待 资源 ， 而 哪些 进程 已 经 准备 就 绪 并 可 以 调度 执行 。 如 果 一 个 
正在 运行 的 进程 需要 LO 或 其 他 资源 ， 则 它 将 自动 放弃 CPU 的 控制 权 ， 并 将 自己 置 于 等 待 队 
列 ， 然 后 另 一 个 进程 被 调度 执行 。 这 一 过 程 就 构成 了 上 下 文 切换 。 

在 上 下 文 切换 过 程 中 ， 当 前 正在 执行 进程 的 相关 信息 被 保存 ， 以 便 其 重新 被 调度 执行 时 ， 
可 以 准确 恢复 该 进程 中 断 时 所 处 的 状态 。 在 上 下 文 切换 过 程 中 保存 的 信息 包括 所 有 CPU 寄存 
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器 中 的 内 容 、 页 表 以 及 其 他 和 虚拟 存储 器 相关 的 信息 。 一 旦 这 些 信 息 安全 地 保存 后 ， 一 个 之 前 
中 断 的 进程 ( 即 一 个 正 准备 使 用 CPU 的 进程 ) 就 会 准确 地 恢复 成 中 断 前 的 状态 。 (当然 如 果 是 
一 个 全 新 的 进程 ， 则 不 用 恢复 之 前 的 状态 。) 

进程 会 在 两 种 情况 下 放弃 对 CPU 的 控制 权 。 在 非 抢 占 式 调度 中 ， 进 程 自动 放弃 CPU 的 控 
制 权 可 能 是 因为 它 正在 请 求 男 一 个 当前 不 能 调度 的 资源 。 然 而 ,假如 系统 是 基于 时 间 片 设计 
的 ， 那 么 进程 可 能 会 被 操作 系统 从 运行 状态 置 为 等 待 状态 。 这 称 为 抢占 式 调度 ， 因 为 当前 进 
程 被 抢占 ，CPU 的 控制 权 被 操作 系统 剥夺 。 抢 占 也 可 能 发 生 在 基于 优先 权 的 进程 调度 和 中 
断 过 程 中 。 例 如 ， 如 果 一 个 低 优 先 权 的 进程 正在 执行 ， 此 时 一 个 高 优先 权 的 进程 需要 使 用 
CPU， 则 低 优 先 权 的 进程 会 置 于 就 绪 队 列 ( 发 生 一 次 上 下 文 切 换 ) ， 高 优先 权 进 程 会 立即 
执行 

在 进程 调度 过 程 中 操作 系统 的 主要 任务 就 是 决定 应 当 调 度 哪 个 进程 来 使 用 CPU。 影 响 调 度 
决定 的 因素 包括 CPU 的 利用 率 、 吞 吐 量 、 轮 转 时 间 、 等 待 时 间 以 及 响应 时 间 。 短 期 调度 有 多 
种 实现 方式 ， 包 括 先 来 先 服务 (FCFS) 、 最 短 作 业 优 先 (SJF)、 循 环 以 及 优先 权 调度 。 在 FCFS 
中 ， 进 程 按照 请 求 的 顺序 被 分 配 处 理 器 资源 。 但 只 有 执行 的 进程 终止 后 ， 才 会 放弃 CPU 的 控 
制 权 。FCFS 是 一 种 非 抢 占 式 算法 ， 其 优点 是 容易 实现 。 然 而 ， 这 种 算法 对 于 多 用 户 系统 是 不 
适用 的 ， 因 为 进程 等 待 CPU 的 平均 时 间 会 有 很 大 的 变化 。 此 外 ， 一 个 进程 可 能 会 独占 CPU， 
造成 挂 起 进程 的 执行 时 间 的 过 度 延 迟 。 

在 最 短 作 业 优 先 调度 中 ， 系 统 执行 时 间 最 短 的 进程 相 比 其 他 进程 具有 更 高 的 调度 优先 权 
已 证 明 SJF 是 最 优 的 调度 算法 。 但 这 个 算法 的 最 大 问题 是 没有 方法 提前 预知 一 个 进程 准确 的 运 
行 时 间 。 使 用 SJF 的 操作 系统 通常 采用 一 些 启 发 式 方法 来 估计 进程 的 运行 时 间 ， 但 这 些 启发 式 
方法 的 效果 并 不 好 。SJF 可 以 是 抢占 式 的 ， 也 可 以 是 非 抢 占 式 的 。( 抢 占 式 通常 称 为 最 短 剩余 
时 间 优 先 。) 

循环 调度 是 一 个 公平 且 简 单 的 抢占 式 调度 策略 。 给 每 个 进程 分 配 一 个 确定 的 CPU 时 间 片 
如 果 一 个 进程 的 时 间 片 用 完 后 该 进程 仍然 在 运行 ， 则 通过 上 下 文 切换 将 该 进程 换 出 ， 处 于 等 待 
队列 中 的 下 一 个 进程 被 分 配属 于 它 的 CPU 时 间 片 。 循 环 调度 在 分 时 系统 中 广泛 使 用 。 当 调度 
器 采用 足够 短 的 时 间 片 时 ， 系 统 中 的 多 个 用 户 意 识 不 到 他 们 正在 共享 系统 资源 。 然 而 ， 时 间 片 
不 应 当 过 小 ， 以 避免 上 下 文 切换 时 间 过 长 。 

优先 权 调 度 为 每 个 进程 分 配 一 个 优先 权 。 短 期 调度 器 从 就 绪 队列 中 选择 一 个 具有 最 高 优先 
权 的 进程 。 在 FCFS 中 ， 所 有 进程 都 有 相同 的 优先 权 。SJF 中 具有 最 短 执行 时 间 的 进程 拥有 最 
高 优先 权 。 优 先 权 调度 最 大 的 问题 是 可 能 会 造成 资源 独占 或 无 限 阻塞 。 想 象 如 果 你 在 一 个 繁忙 
的 系统 中 试图 运行 一 个 大 规模 的 作业 ， 但 由 于 此 时 还 有 其 他 用 户 频 繁 提 交 具 有 更 短 运行 时 间 的 
作业 (更 高 优先 权 ) ， 而 导致 你 的 作业 一 直 无 法 执行 ， 这 是 多 么 令 人 愧 恼 ? 在 现实 中 就 有 这 样 
的 例子 ， 当 某 个 大 学 中 的 一 台大 型 计算 机 停机 时 ， 在 就 绪 队 列 中 发 现 了 一 个 已 经 等 待 了 几 年 的 
待 调度 作业 。 

一 些 操作 系统 会 将 几 种 调度 方法 进行 组 合 。 例 如 ， 一 个 系统 可 能 使 用 抢占 式 、 基 于 优先 
级 、 先 来 先 服务 的 调度 算法 。 更 加 复杂 的 操作 系统 可 能 还 会 允许 用 户 设置 时 间 片 的 长 短 、 并 发 
的 任务 数 以 及 为 不 同 的 作业 分 配 优先 级 。 

多 任务 (系统 中 有 多 个 并 发 执行 的 进程 ) 和 多 线程 (一 个 进程 划分 为 多 个 不 同 的 线程 ) 对 于 
CPU 调度 提出 了 很 多 挑战 。 线 程 是 系统 中 最 小 的 可 调度 单位 。 线 程 和 其 父 进程 共享 相同 的 可 执 
行 环境 ， 包 括 CPU 寄存 器 和 页 表 。 因 此 ， 线 程 间 上 下 文 切 换 的 开销 远 远 小 于 整个 进程 的 切换 
开销 。 根 据 并 发 的 需要 程度 ， 可 能 存在 单 进程 单线 程 、 单 进程 多 线程 、 多 进程 单线 程 以 及 多 进 
程 多 线程 。 一 个 支持 多 线程 的 操作 系统 必须 能 够 支持 上 述 所 有 的 组 合 。 
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资源 管理 

除了 进程 管理 外 ， 操 作 系 统 还 需要 管理 系统 的 资源 。 因 为 系统 资源 相对 昂贵 ， 所 以 这 些 资 
源 是 共享 的 。 例 如 ， 多 个 进程 共享 一 个 处 理 器 ， 多 个 程序 共享 物理 内 存 ， 多 个 用 户 和 文件 共享 
一 个 人 硬盘。 操作 系统 主要 关注 3 类 资源 : CPU 、 存 储 器 和 IO。CPU 的 访问 权 由 调度 器 控制 。 
对 存储 器 和 LO 的 访问 则 需要 不 同 的 控制 和 功能 部 件 。 

回顾 第 6 章 可 知 ， 大 多 数 现代 系统 通过 虚拟 存储 器 来 扩展 RAM 的 容量 。 这 就 意味 着 可 能 
会 有 几 个 程序 共存 于 主 存 中 ， 每 个 进程 会 有 一 个 页 表 。 起 初 ， 在 操作 系统 能 够 处 理 虚 拟 存储 器 
之 前 ， 程 序 员 使 用 覆盖 技术 实现 虚拟 存储 器 。 如 果 一 个 程序 过 大 以 至 于 无 法 全 部 装 人 内 存 ， 程 
序 员 则 把 它 分 为 几 部 分 ， 仅 将 某 个 时 刻 程序 运行 时 必须 使 用 的 指令 和 数据 加 载 到 内 存 。 此 时 如 
果 需 要 新 的 数据 或 指令 ， 则 完全 由 程序 员 ( 还 需 依靠 编译 器 的 帮助 ) 来 管理 存储 器 。 现 在 ， 操 
作 系 统 接管 了 这 个 任务 。 操 作 系 统 将 虚拟 地 址 转换 为 物理 地 址 ， 与 硬盘 之 间 传 递 页 表 并 维护 页 
表 。 操 作 系 统 还 决定 主 存 的 分 配 ， 并 跟踪 空闲 页 帧 。 当 释放 主 存 空间 时 ， 操 作 系统 执行 垃圾 收 
集 ， 即 将 多 个 主 存 碎片 合并 为 一 个 更 大 的 可 用 主 存 块 。 

除了 管理 共享 的 主 存 之 外 ， 操 作 系 统 还 需要 处 理 共享 的 1/0 设备 。 大 多 数 的 输入 /输出 请 
求 是 由 应 用 程序 发 出 的 。 操 作 系 统 提供 必要 的 服务 来 辅助 完成 输入 /输出 任务 。 当 然 ， 应 用 程 
序 可 以 不 通过 操作 系统 来 处 理 输入 /输出 ， 但 这 样 不 但 会 增加 开发 难度 ， 还 会 引起 保护 和 访问 
权限 的 问题 。 如 果 几 个 不 同 的 进程 试图 同时 使 用 同一 个 IO 设备 ， 这 些 请 求 必 须 协 调 有 序 地 进 
行 处 理 ， 这 正 是 操作 系统 的 任务 。 操 作 系统 一 般 通 过 各 种 系统 调用 提供 一 个 通用 的 VO 接口 。 
这 些 系 统 调用 允许 应 用 程序 通过 操作 系统 去 请 求 一 个 IO 服务 。 然 后 ， 操 作 系 统 再 去 调用 设备 
驱动 程序 ， 这 些 驱 动 通过 若干 软件 程序 来 控制 特定 IO 设备 以 完成 一 系列 相关 的 功能 。 

操作 系统 还 负责 管理 磁盘 文件 ， 如 创建 文件 、 删 除 文件 、 创 建 目 录 、 删 除 目 录 等 。 并 且 还 
提供 操纵 文件 或 目录 的 原 语 及 其 映射 到 辅 存 的 支持。 虽然 LO 设备 驱动 负责 许多 特定 细节 ， 但 
仍 需 操 作 系 统 协调 这 些 驱 动 以 支持 IO 功能 。 

安全 和 保护 

作为 进程 和 资源 管理 者 时 ， 操 作 系统 需要 确保 正确 性 、 公 平 性 以 及 高 效 性 。 然 而 ， 共 享 资 
源 会 产生 大 量 的 安全 隐患 ， 比 如 未 授权 的 访问 或 数据 算 改 。 因 此 ， 操 作 系 统 还 需要 扮演 资源 保 
护 者 的 角色 ， 以 确保 不 会 受到 恶意 软件 的 破坏 。 并 发 进程 必须 保护 彼此 之 间 的 安全 ， 并 且 必 须 
保护 操作 系统 进程 以 防 被 用 户 进程 破坏 。 如 果 没 有 这 些 保护 措施 ， 一 个 用 户 程序 可 能 会 擦 除 操 
作 系 统 中 用 于 处 理 中 断 的 代码 。 在 多 用 户 系统 中 需要 额外 的 安全 措施 来 保护 共享 资源 (如 存储 
器 和 LO 设备 ) 和 非 共享 资源 (如 个 人 文件 ) 。 存 储 器 防护 会 保护 用 户 程序 中 的 某 个 缺陷 不 会 对 
其 他 程序 产生 影响 或 一 个 恶意 程序 不 会 获得 系统 的 控制 权 。CPU 防护 可 以 确保 用 户 程序 不 会 陷 
入 死 循环 ， 以 避免 消耗 其 他 任务 所 需 的 CPU 时 间 。 

操作 系统 会 以 多 种 方式 提供 安全 服务 。 首 先 ， 活动 进程 会 限制 在 自己 的 存储 空间 内 执行 。 
所 有 对 VO 或 其 他 资源 的 请 求 必 须 通 过 操作 系统 来 完成 。 操 作 系 统 在 用 户 模 式 下 执行 大 多 数 命 
令 ， 其 他 命令 在 内 核 模 式 下 执行 。 通 过 这 种 方式 ， 避 免 了 对 资源 的 非 授权 访问 。 操 作 系 统 还 提 
供 其 他 措施 来 控制 用 户 访问 ， 一 般 是 通过 登录 名 和 密码 。 可 通过 将 进程 限制 到 一 个 独立 的 子 系 
统 中 来 实现 更 强 的 保护 。 


8.3 保护 环境 
为 了 提供 保护 机 制 ， 多 用 户 操作 系统 应 防止 进程 在 系统 中 无 序 运行 。 进 程 执行 必须 与 操作 


系统 和 其 他 进程 相隔 离 。 必 须 控 制 和 协调 对 共享 资源 的 访问 以 避免 冲突 。 目 前 ， 有 很 多 方式 可 
以 在 系统 中 构建 安全 屏障 。 在 本 节 中 ， 我 们 解释 其 中 的 3 种 方式 : 虚拟 机 、 子 系统 以 及 分 区 。 





8. 3.1 虚拟 机 

20 世纪 50 年 代 和 60 年 代 的 分 时 系统 一 直 在 试图 解决 与 共享 资源 相关 的 问题 ， 这 些 共享 资 
源 包括 内 存 、 磁 盘存 储 器 、 读 卡 器 、 打 印 机 以 及 处 理 器 周期 。 那 个 时 代 的 硬件 还 不 能 使 很 多 计 
算 机 科学 家 的 想法 得 以 实现 。 其 中 一 个 很 好 的 想法 是 每 个 用 户 进程 都 有 一 个 属于 自己 的 机 
器 一 一 一 个 在 真实 机 器 内 部 、 可 以 与 其 他 虚拟 机 器 共存 的 虚拟 机 器 。 到 了 20 世纪 60 年 代 后 期 
和 70 年 代 早 期 ， 硬 件 终于 支持 将 “虚拟 机 ”的 概念 实现 于 分 时 通用 的 计算 机 中 。 

虚拟 机 在 概念 上 十 分 简单 。 真 实 计算 机 中 的 真实 硬件 是 在 一 个 控制 程序 (或 内 核 ) 的 控制 
之 下 。 控 制程 序 可 以 创建 任意 数目 的 虚拟 机 ， 这 些 虚拟 机 在 内 核 下 运行 时 就 好 像 是 普通 的 用 户 
进程 ， 和 用 户 空 间 中 运行 的 任何 程序 受到 同样 的 限制 。 控 制程 序 将 每 个 虚拟 机 都 表示 成 一 个 真 
实 机 融 硬 件 的 镜像 。 每 个 虚拟 机 会 “看 到 ”一 个 由 CPU、 寄 存 器 、LO 设备 以 及 ( 虚拟) 存储器 
构成 的 虚拟 环境 ， 就 好 像 这 些 资源 都 是 这 台 虚 拟 机 所 独 有 的 。 因 此 ， 虚 拟 机 就 是 一 台 具 有 全 部 
系统 资源 的 镜像 机 器 。 如 图 8-1 所 示 ， 一 个 运行 在 虚拟 机 上 的 用 户 程 序 可 以 访问 该 虚拟 机 中 
的 任何 资源 。 例 如 ， 当 一 个 程序 通过 调用 系统 服务 将 数据 写 到 硬盘 时 ， 它 会 执行 在 真实 机 
器 运行 时 使 用 的 调用 。 虚 拟 机 接收 /0 请 求 并 将 这 些 请 求 传 递 给 控制 程序 以 便 在 真实 硬件 上 
执行 。 





真实 的 CPU 


纪 了 





虚拟 机 





图 8-1 运行 在 控制 程序 下 的 虚拟 机 镜像 
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在 虚拟 机 上 运行 一 个 和 真实 操作 系统 不 同 的 系统 是 完全 有 可 能 的 。 同 样 ， 每 台 虚 拟 机 都 可 
以 运行 一 个 和 其 他 虚拟 机 不 同 的 操作 系统 。 实 际 上 ， 这 些 情况 都 是 很 常见 的 。 

如 果 在 微软 的 Windows( 从 95 到 XP) 系统 中 打开 一 个 “MS- DOS” 命 令 行 窗 口 ， 那 么 就 已 
经 初始 化 了 一 个 虚拟 机 环境 。Windows 系统 的 控制 程序 称 为 Windows 虚拟 机 管理 器 (VMM ) 。 
VMM 是 一 个 32 位 的 保护 模式 子 系统 (有 关子 系统 的 介绍 请 看 下 一 节 ) ， 可 以 创建 、 运 行 、 监 控 
以 及 终止 虚拟 机 。VMM 在 系统 启动 时 被 加 载 到 内 存 中 。 当 通过 命令 窗口 调用 时 ，VMM 创建 一 
个 “MS-D0OS” 虚拟 机 ， 它 是 运行 在 16 位 Intel 8086/8088 处 理 器 上 的 虚拟 镜像 。 虽 然 真 实 的 机 
器 有 更 多 的 寄存 器 (它们 是 32 位 宽 ) ， 但 在 DOS 环境 中 执行 的 任务 仅仅 能 够 看 到 8086/8688 处 
理 中 有 限 数目 的 16 位 处 理 器 。VMM 控制 程序 将 16 位 指令 转化 (在 虚拟 机 术语 中 ， 称 为 形式 转 
换 ) 为 32 位 指令 ， 以 便 这 些 指 令 可 以 在 真实 的 处 理 器 上 运行 。 

为 了 处 理 硬 件 中 断 ， 每 当 系统 启动 时 ，VMM 都 加 载 一 组 预先 定义 的 虚拟 设备 驱动 ( VxD ) 。 
每 个 VxD 可 以 模拟 一 个 外 部 硬件 ， 或 模拟 一 个 可 通过 特权 指令 访问 的 可 编程 接口 。VMM 辅助 
以 32 位 保护 模式 动态 地 链接 库 ( 见 8. 4.3 节 ) ， 人 允许 虚拟 设备 获取 中 断 和 故障 。 通 过 这 种 方式 
控制 应 用 对 硬件 设备 和 系统 软件 的 访问 。 







当然 ， 虚 拟 机 也 是 虚拟 存储 器 ， 在 这 里 必须 和 操作 系 4GB 
统 以 及 其 他 运行 在 这 个 操作 系统 下 的 虚拟 机 共享 存储 空间 。 页 表 和 虚拟 设备 驱动 VxD 
Windows 95 的 存储 器 地 址 分 配 如 图 8-2 所 示 。 每 个 进程 位 Wa 3GB 


于 从 1MB ~ 1GB 的 私有 地 址 空间 中 。 其 他 进程 访问 是 不 能 
这 个 私有 地 址 空间 的 。 如 果 一 个 未 授权 的 进程 试图 访问 受 
男 一 个 进程 或 操作 系统 保护 的 存储 空间 ， 那 么 会 产生 一 个 
保护 故障 ， 这 个 故障 将 通过 显示 器 呈现 出 来 。 处 于 共享 存 
储 区 域 的 数据 和 代码 可 以 共享 处 理 器 。 在 图 8-2 中 上 面 的 
区 域 保 存 了 除 动态 链接 库 之 外 的 系统 虚拟 机 组 件 。 下 面 的 
区 域 是 不 可 寻 址 的 ， 可 以 用 来 检测 指针 错误 。 

当 现代 系统 支持 虚拟 机 时 ， 它 们 就 可 以 对 大 型 企业 级 
计算 机 提供 所 需 的 保护 、 安 全 和 可 管理 性 。 虚 拟 机 也 为 数 
不 清 的 硬件 平台 提供 了 可 兼容 性 。 例 如 ， 将 在 8.5 节 中 讲 16 位 堆 空 间 
述 的 Java 虚拟 机 。 ; 


8. 3. 2 子 系统 和 分 区 


Window VMM 是 一 个 在 Windows 启动 时 启动 的 子 系统 。 图 8-2 ”Windows 95 的 存储 器 映像 
Windows 还 会 启动 其 他 有 具有 特殊 用 途 的 子 系统 ， 它 们 用 于 
文件 管理 、L/O， 以 及 配置 管理 。 子 系统 构建 了 人 逻辑 上 隔离 的 环境 ， 这 个 环境 能 够 被 单独 地 配 
置 和 管理 。 子 系统 运行 在 操作 系统 内 核 之 上 ， 可 借助 内 核 访问 基本 的 系统 资源 ， 如 在 几 个 子 系 
统 间 共 享 的 CPU 调度 器 。 

每 个 子 系统 都 必须 定义 在 控制 系统 的 上 下 文中 。 这 些 定义 包括 资源 描述 ， 如 硬盘 文件 、 
输入 /输出 队列 以 及 各 种 硬件 模块 ( 如 终端 、 打 印 机 等 )。 在 子 系统 中 定义 的 资源 对 于 内 核 并 
不 一 定 直接 可 见 ， 但 在 定义 它们 的 子 系统 中 是 可 见 的 。 在 子 系统 中 定义 的 资源 既 可 以 和 其 
他 子 系统 共享 ， 也 可 以 不 和 其 他 子 系统 共享 。 网 8-3 描述 了 子 系统 和 其 他 系统 之 间 的 概念 性 

子 系统 有 助 于 大 型 、 复 杂 计 算 机 系统 的 管理 。 因 为 每 个 子 系统 都 是 一 个 独立 的 可 控 个 
体 ， 所 以 系统 管理 员 可 以 独立 地 启动 和 关闭 子 系统 ， 不 会 受到 操作 系统 或 其 他 正在 运行 的 
子 系统 的 干扰 。 每 个 子 系统 也 可 以 独立 分 配 系统 资源 ， 如 增加 或 减少 硬盘 或 内 存 的 空间 。 


16 位 Windows 应 用 程序 
和 动态 链接 库 


私有 地 址 空间 
( 为 32 位 Windows 进 程 所 专用 ) 


”不 可 导 址 空间 
( 32 位 Windows 应 用 程序 ) 
4MB 
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此 外 ， 如 果 一 个 进程 脱离 了 其 隶属 的 子 系统 的 控制 ， 或 造成 了 系统 崩溃 ， 那 么 通常 只 是 运 
行 这 个 进程 的 子 系统 会 受到 影响 。 因 此 ， 子 系统 不 仅 可 使 计算 机 系统 更 便于 管理 ， 而 且 也 
使 它们 更 加 健壮 。 





图 8-3 可 定义 为 多 子 系统 的 单个 资源 


在 大 型 计算 机 系统 中 ， 子 系统 还 远 远 达 不 到 对 机 器 及 资源 进行 划分 的 目的 。 有 时 候 ， 还 需 
要 一 个 更 加 复杂 的 保护 机 制 来 实施 安全 防护 和 资源 管理 。 此 时 ， 一 个 系统 可 能 被 划分 为 几 个 逻 
辑 分 区 ， 有 时 候 称 为 LPAR， 如 图 8-4 所 示 。LPAR 在 一 个 物理 系统 中 可 创建 若干 独立 的 机 器 ， 
并 且 这 些 机 器 间 共 享 所 有 资源 。 相 比 在 物理 上 分 离 的 系统 中 运行 分 区 而 言 ， 逻 辑 分 区 间 的 信息 
交互 也 没有 变 得 更 容易 。 例 如 ， 如 果 系 统 有 两 个 分 区 A 和 B， 分 区 A 唯一 能 够 读 取 分 区 B 中 文 
件 的 条 件 是 两 个 分 区 协同 建立 一 个 可 交互 的 共享 资源 ， 比 如 流水 线 或 消息 队列 。 一 般 说 来 ， 仅 
能 通过 文件 传输 协议 或 系统 厂商 定制 的 工具 才能 实现 在 两 个 分 区 间 的 文件 传输 。 





图 8-4 逻辑 分 区 以 及 控制 系统 : 分 区 间 无 法 简单 地 共享 资源 


则 辑 分 区 在 建立 “ 沙 箱 ” 运 行 环境 时 尤其 有 用 ， 可 以 帮助 用 户 训 练 或 测试 新 程序 。 沙 箱 
环境 可 由 任何 用 户 在 满足 约束 条 件 下 进行 命名 。 沙 箱 环 境 对 于 能 否 访问 系统 资源 具有 严格 的 限 
制 。 在 一 个 分 区 中 运行 的 进程 不 能 有 意 或 无 意 地 访问 另 一 个 分 区 中 的 数据 或 进程 。 因 此 ， 分 区 
机 制 通过 禁止 进程 访问 未 授权 的 资源 ， 提 升 了 系统 的 安全 级 别 。 
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虽然 ， 子 系统 和 分 区 在 如 何 定义 资源 方面 并 不 相同 ， 但 是 你 可 以 把 它们 都 看 成 是 计算 机 系 
统 中 分 层 系统 体系 结构 的 小 型 模型 。 在 分 区 环境 中 ， 这 些 层 级 看 起 来 像 是 相 邻 层 的 生日 蛋糕 ， 
从 硬件 级 扩展 到 应 用 级 。 另 一 方面 ， 子 系统 彼此 之 间 的 区 别 并 不 明显 ， 大 部 分 的 差异 发 生 在 系 
统 软 件 级 


8. 3. 3 保护 环境 和 系统 结构 的 演变 


直到 最 近 ， 虚 拟 机 、 子 系统 和 逻辑 分 区 都 被 认为 是 陈旧 的 大 型 机 系统 技术 的 产物 。 在 整个 
20 世纪 90 年 代 ， 越 来 越 小 的 机 器 被 广泛 使 用 ， 相 比 大 型 机 ， 人 们 相信 这 些 机 器 性 价 比 更 高 。 
“客户 端 - 服务 器 端 ” 模 式 也 被 认为 对 于 动态 业务 环境 具有 更 高 的 用 户 友 好 性 和 响应 性 。 面 向 
小 型 系统 的 应 用 程序 开发 很 快 对 编程 能 力 有 很 强 的 需求 。 办 公 自 动 化 程序 ( 如 文本 处 理 和 日 历 
管理 ) 更 适合 基于 小 型 文件 服务 器 的 协同 网 络 环境 。 打 印 服务 器 控制 的 网 络 激光 打印 机 可 以 在 
白 纸 上 输出 清晰 的 文字 ， 而 大 型 行 式 打印 机 只 能 输出 带 有 污渍 的 文字 ， 并 且 其 打印 速度 也 比 不 
上 前 者 。 无 论 按照 哪 种 标准 ， 相 比 大 型 计算 机 ， 具 有 相同 计算 机 能 力 的 台式 机 和 小 型 服务 器 具 
有 更 低 的 成 本 。 计 算 能 力 仅 是 企业 级 计算 系统 设计 时 所 需 考虑 的 一 个 方面 。 

当 办 公 自 动 化 任务 转移 到 台式 计算 机 上 之 后 ， 办 公 网 络 将 所 有 的 台式 计算 机 以 及 文件 服务 
器 连接 起 来 ， 以 存储 文档 和 其 他 重要 的 商业 信息 。 应 用 服务 器 用 于 执行 核心 的 商务 管理 任务 。 
当 公 司 接 人 因特网 之 后 ， 电 子 邮 件 和 网 络 服务 器 也 加 入 到 了 网 络 中 。 如 果 任 何 一 个 服务 器 停止 
工作 ， 则 最 简单 的 解决 办 法 就 是 再 将 一 个 服务 器 加 入 到 网 络 中 来 代替 它 。 到 了 20 世纪 90 年 代 
后 期 ， 很 多 大 型 企业 都 拥有 巨大 的 服务 器 群 ， 在 环境 可 控 、 安 全 有 保障 的 条 件 下 支持 成 百 上 千 
个 独立 的 服务 器 。 服 务 器 群 马 上 对 人 力 资 源 产生 了 巨大 的 需求 ， 每 个 服务 器 都 必须 给 予 高 度 的 
关注 。 每 个 服务 器 上 的 内 容 都 必须 备份 到 磁带 上 ， 随 后 这 些 磁带 被 卷 起 保存 以 保证 安全 性 。 随 
着 故障 诊断 和 软件 补丁 成 为 日 常任 务 ， 每 个 服务 器 都 可 能 成 为 一 个 故障 源 。 因 此 ， 小 型 系统 的 
成 本 优势 很 快 变 得 不 再 像 之 前 那样 明显 。 这 种 现象 对 于 支持 成 百 上 千 台 小 型 服务 器 系统 的 企业 
尤为 显著 。 

每 个 大 型 计算 机 生产 厂商 现在 都 会 提供 服务 器 整合 产品 。 不 同 的 厂商 采用 不 同 的 方法 来 设 
计 这 个 产品 。 最 有 趣 的 一 个 想法 就 是 在 一 个 大 型 计算 机 系统 中 创建 多 个 逻辑 分 区 以 支持 多 个 虚 
拟 机 。 服 务 器 整合 有 很 多 优势 ， 包 括 如 下 几 个 方面 : 

e 相 比 管理 一 大 批 小 型 计算 机 ， 管 理 一 台大 型 计算 机 会 更 加 容易 。 

e 相 比 具 有 相同 计算 能 力 的 多 台 小 型 计算 机 ， 一 台大 型 计算 机 系统 的 耗 电 量 更 少 。 

e 用 电量 的 减少 使 得 计算 机 系统 散发 的 热量 变 少 ， 因 此 节省 了 致 冷 的 成 本 。 
大 型 计算 机 系统 能 够 提供 更 好 的 故障 转移 保护 。( 系 统 通常 都 带 有 热 备 磁盘 和 处 理 器 。) 
单个 系统 更 容易 备份 和 恢复 。 
单个 系统 占用 的 空间 更 小 ， 降 低 了 场地 成 本 。 
相 比 大 批 小 型 计算 机 ， 单 个 大 型 系统 的 软件 授权 费 可 能 更 低 。 

e 大 型 系统 需要 更 少 的 人 力 ， 并 且 用 户 程序 仅 需 在 一 个 系统 上 进行 更 新 。 

大 型 系统 厂商 (如 IBM、Unisys 以 及 惠普 等 ) ， 很 快 就 抓 住 了 服务 器 整合 的 商机 。 很 多 IBM 
的 大 型 机 和 中 型 机 被 重新 整合 为 zSeries 服务 器 。 其 中 ，System/390 大 型 机 因为 zSeries 服务 器 
而 重 获 新 生 。zSeries 服务 器 可 以 支持 60 个 逻辑 分 区 。 每 个 运行 IBM 虚拟 机 操作 系统 的 逻辑 分 
区 可 以 定义 成 千 上 万 个 虚拟 的 Linux 系统 。 图 8-5 展示 了 一 个 zSeries/Linux 配置 模型 。 相 比 独 
立 的 Linux， 每 个 虚拟 的 Linux 系统 同样 具有 支持 企业 级 应 用 和 电子 商务 活动 的 能 力 ， 但 它 没有 
额外 的 管理 开销 。 因 此 ， 原 来 一 个 足球 场 大 小 的 服务 器 群 可 以 用 一 个 仅 比 家 用 冰箱 占 地 稍 大 的 
zSeries 服务 器 所 取代 。 可 以 说 ， 服 务 器 整合 技术 是 操作 系统 变革 的 一 个 缩影 。 








图 8-5 ”IBM zSeries 服务 器 逻辑 分 区 内 的 Linux 虚拟 机 


8.4 编程 工具 

操作 系统 及 其 相关 的 应 用 程序 为 编写 程序 的 用 户 和 运行 程序 的 系统 提供 了 接口 。 而 其 他 实 
用 工具 ， 特 别 是 编程 工具 ， 对 于 软件 编写 的 特性 是 十 分 必要 的 。 我 们 将 在 以 本 节 中 讨论 与 编程 
工具 相关 的 内 容 。 


8.4.1 汇编 程序 和 汇编 


在 计算 机 系统 分 层 结 构 中 ， 操 作 系 统 层 之 上 的 是 汇编 语言 层 。 在 第 4 章 中 ,我 们 提 到 的 
MARIE 是 一 个 简单 的 假想 机 器 结构 。 实 际 上 ， 这 个 机 器 结构 太 简单 了 ， 以 至 于 在 现实 中 没有 
任何 一 台 计算 机 曾经 使 用 过 这 个 结构 。 其 中 一 个 原因 是 ， 连 续 地 从 存储 器 中 获取 操作 数 将 使 系 
统 运 行 非常 缓慢 。 真 实 的 计算 机 通过 提供 足够 数目 可 寻 址 的 片上 寄存 器 来 最 小 化 存储 器 的 访 
问 。 此 外 ,任何 一 台 真正 计算 机 的 指令 集体 系 结构 也 比 MARIE 丰富 得 多 。 许 多 微 处 理 器 在 指 
令 库 里 都 有 超过 1000 条 的 不 同 指令 . 

虽然 MARIE 和 真实 计算 机 十 分 不 同 ,但 它们 汇编 过 程 是 类 似 的 。 实 际 上 ， 现 在 所 使 用 的 
任何 一 款 汇 编程 序 都 将 遍历 源 代码 两 次 。 第 一 次 遍历 将 完成 部 分 源码 的 汇编 ， 同 时 建立 一 张 符 
号 表 。 第 二 次 遍历 使 用 从 第 一 次 遍历 时 建立 的 符号 表 中 获得 的 地 址 生成 全 部 二 进 制 指令 。 

大 多 数 汇编 程序 输出 的 是 一 个 可 重 定位 的 二 进 制 指令 流 。 操 作 系 统 可 将 程序 加 载 到 内 存 的 
任意 位 置 ， 当 操作 数 的 地 址 与 加 载 程序 在 内 存 中 的 位 置 相 关 时 ， 二 进 制 代码 将 会 重 定位 。 以 
表 4-5 中 的 MARIE 代码 为 例 : 


Load x 
Add y 
Store z 
Halt 
ww DE 35 
y, DEC -23 
z, HEX 0000 


汇编 后 的 输出 代码 如 下 : 


1+004 
3+005 
2+006 
7000 
0023 
FFE9 
0000 
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在 例子 中 , “+ ”并 不 表示 执行 加 法 操作 。 它 用 于 告知 程序 加 载 器 (操作 系统 的 一 个 组 件 ) 
第 一 条 指令 中 的 004 是 相对 于 程序 起 始 地 址 的 偏 移 量 。 假 设 如 果 加 载 器 将 程序 放 到 内 存 地 址 
0x250 中 ， 则 上 述 指令 在 内 存 中 是 如 何 分 布 的 ， 如 表 8-1 所 示 。 

如 果 加 载 器 认为 应 当 将 程序 放 在 内 存 地 址 0x400 处 ， 则 上 述 指 令 在 内 存 中 的 分 布 如 表 8-2 
所 示 。 


表 8-1 当 程 序 加 载 到 地 址 0x250 时 内 存 中 的 内 容 。 表 8-2 当 程 序 加 载 到 地 址 0x400 时 内 存 中 的 内 容 























地 址 内 存 中 的 内 容 地 址 | 内 存 中 的 内 容 
0x250 1254 0x400 1404 
0x251 i 3255 0x401 3405 
0x252 2256 0x402 2406 
i 7000 0x403 | 7000 























0x254 0023 0x404 0023 
0x255 FFE9 0x405 FFE9 
- 0x256 0000 0x406 0000 


相对 于 可 重 定位 代码 ， 绝 对 代码 是 可 执行 的 二 进 制 代码 ， 它 必须 总 是 放 在 内 存 的 一 个 特定 
地 址 中 。 不 可 重 定位 代码 在 一 些 计算 机 系统 中 用 在 一 些 具有 特定 目的 的 应 用 中 。 通 常 ， 这 些 应 
用 涉及 对 附加 设备 的 显 式 控制 或 是 对 系统 软件 的 操控 ， 其 中 一 些 特定 的 软件 例 程 总 是 被 分 配 在 
内 存 的 固定 位 置 中 。 

当然 ， 二 进 制 指令 不 能 用 “ + ”来 区 分 可 重 定位 代码 和 不 可 重 定位 代码 。 区 分 两 者 的 方式 取 
决 于 运行 这 些 代码 的 操作 系统 的 设计 。 一 种 区 分 二 者 的 最 简单 方式 是 使 用 不 同 的 文件 类 型 ( 扩 
展 ) 。 在 MS-DOS 中 ,使 用 . COM( 表 示 一 个 命令 文件 ) 扩 展 名 来 表示 不 可 重 定位 文件 ,使 用 . EXE 
(表示 一 个 可 执行 文件 ) 扩 展 名 来 表示 可 重 定位 文件 。COM 文件 总 是 被 加 载 到 地 址 0x100 上 ，EXE 
文件 可 以 被 加 载 到 内 存 的 任意 地 址 中 ， 甚 至 不 一 定 占据 连续 的 存储 空间 。 另 一 种 区 分 的 方法 是 在 
可 执行 文件 中 加 入 前 缀 或 报 文 信息 ， 当 加 载 器 从 硬盘 上 读 取 该 程序 时 就 可 获知 相关 的 信息 。 

当 可 重 定位 代码 加 载 到 内 存 后 ， 通 常 需要 特 a 
殊 的 寄存 器 提供 程序 的 基地 址 。 这 时 程序 中 的 所 表 8-3 the 
有 地 址 都 被 认为 是 相对 于 寄存 器 中 基地 址 的 偏 移 go A 
量 。 在 表 8- 1 中 ,加 载 器 将 代码 放置 在 内 存 的 


























0x250 处 ， 那 么 真实 的 系统 只 需 简单 地 将 0x250 保 Te 
存在 程序 基地 址 寄存 器 中 ， 程 序 无 须 进行 任何 修 i 
改 即 可 执行 。 如 表 8-3 所 示 ， 利 用 存储 在 基 址 寄 i 
存 器 中 的 0x250， 每 个 操作 数 的 地 址 都 变 成 了 一 个 a ee 
有 效 地 址 。 0x255 FFE9 

无 论 是 可 重地 位 代码 还 是 不 可 重 定位 代码 ， 





一 个 程序 的 指令 和 数据 都 必须 与 实际 物理 地 址 绑 

定 。 指 令 和 数据 与 存储 器 地 址 的 绑 定 可 以 发 生 在 编译 、 加 载 或 执行 时 。 绝 对 代码 是 一 个 编译 时 
绑 定 的 例子 ， 当 程序 编译 时 ， 将 对 引用 的 指令 和 数据 与 物理 地 址 进行 绑 定 。 仅 只 有 在 一 个 进程 
镜像 相对 于 内 存 的 加 载 地 址 可 以 提前 获知 的 情况 下 ， 编 译 时 绑 定 才 有 效 。 然 而 ， 对 于 编译 时 绑 
定 ， 如 果 进 程 镜像 的 起 始 地 址 发 生 了 改变 ， 则 必须 重新 编译 相关 代码 。 如 果 一 个 进程 镜像 在 内 
存 中 的 位 置 无 法 在 编译 时 获知 ， 则 产生 可 重 定位 代码 ， 并 可 在 加 载 时 或 运行 时 绑 定 。 加 载 时 绑 
定 会 在 二 进 制 文件 加 载 到 内 存 时 为 每 个 引用 都 加 上 一 个 该 进程 的 起 始 地 址 。 但 是 ， 对 于 加 载 时 





绑 定 ， 在 执行 期 间 不 能 移动 进程 镜像 ， 因 为 进程 的 起 始 地 址 必须 保持 一 致 。 运 行 时 绑 定 ( 执行 
时 绑 定 ) 将 地 址 绑 定 一 定 延 迟 至 实际 执行 相关 进程 的 时 候 。 这 使 得 进程 镜像 在 执行 期 间 可 以 从 
内 存 的 一 个 地 址 移动 到 另 一 个 地 址 。 因 此 ， 和 运行 时 绑 定 需要 特殊 硬件 以 支持 地 址 映射 ， 或 将 好 
辑 地 址 转换 成 物理 地 址 。 一 个 额外 的 虚拟 存储 器 用 来 快速 地 执行 这 个 转换 过 程 。 一 个 特殊 的 基 
址 寄存 器 用 来 存储 程序 的 起 始 地 址 ， 并 将 该 地 址 与 CPU 发 出 的 访 存 地 址 相 加 。 如 果 进 程 镜 像 
发 生 了 移动 ， 则 基 址 寄存 器 更 新 为 进程 新 的 起 始 地 址 。 


8. 4.2 链接 器 


在 大 多 数 系 统 中 ， 编 译 需 的 输出 必须 经 过 链接 编辑 器 (也 称 链接 器 ) 才能 在 目标 系统 上 运 
行 。 链 接 是 将 一 个 程序 的 外 部 符号 与 所 有 其 他 文件 的 导出 符号 进行 匹配 的 过 程 ， 并 产生 一 个 不 
包含 任何 未 解析 外 部 符号 的 单一 二 进 制 文件 。 如 图 8-6 所 示 ， 一 个 链接 器 的 主要 工作 就 是 将 相 
关 程 序 文件 组 合 为 一 个 统一 的 可 加 载 模块 。( 图 中 的 例子 使 用 DOSAWindows 环境 下 的 文件 扩展 
名 。) 例 子 中 所 涉及 二 进 制 文件 可 以 是 由 用 户 编写 的 ， 也 可 以 通过 与 标准 系统 库 合 并 得 到 ， 这 取 
决 于 应 用 的 需要 。 此 外 ， 二 进 制 链 接 器 的 输入 可 以 由 任意 编译 器 产生 。 这 就 允许 一 个 程序 的 不 
同 部 分 可 以 使 用 不 同 语言 来 编写 ， 因 此 为 了 编码 方便 ， 一 个 程序 的 某 个 部 分 可 以 使 用 C++ 编 
写 ， 而 为 了 加 快 程序 的 执行 速度 ， 另 一 部 分 运行 缓慢 的 代码 可 以 通过 汇编 语言 编写 。 

MyProg.obj 
( 主 程序 ) 





MyProg.exe 








ProcC.obj 


ProcB.ob] 


图 8-6 链接 和 加 载 二 进 制 模 块 
与 汇编 器 类 似 ， 大 多 数 的 链接 器 也 需要 两 遍 遍 历 才能 产生 完整 的 包括 所 有 外 部 输入 模块 的 
可 加 载 模 块 。 在 第 一 遍 遍 历 中 ,链接 器 生成 一 个 全 局 外 部 符号 表 ， 这 个 表 包 含 每 个 外 部 符号 的 
名 字 以 及 它们 相对 于 最 终 模块 起 始 地 址 的 偏 移 地 址 。 在 第 二 遍 遍 历 中 ， 将 把 各 个 外 部 符号 的 所 
有 引用 蔡 换 为 符号 表 中 相应 的 偏 移 地 址 。 此 外 ， 在 第 二 遍 遍历 中 ， 可 将 与 平台 相关 的 代码 也 添 
加 进来 ， 生 成 最 终 统一 可 加 载 的 二 进 制 程序 文件 。 


8.4.3 动态 链接 库 
一 些 操 作 系统 ， 尤 其 是 微软 的 Windows， 在 创建 可 执行 文件 前 不 需要 一 次 性 链接 程序 所 需 
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要 的 所 有 模块 。 通 过 在 源 程序 中 使 用 相应 的 语句 ， 某 些 外 部 模块 可 以 在 运行 时 被 链接 。 这 些 外 
部 模块 称 为 动态 链接 库 ( DLL) ， 仅 当 第 一 次 调用 时 才 会 对 这 些 模 块 进行 链接 。 动 态 链接 的 过 程 
如 图 8-7 所 示 。 当 加 载 每 个 动态 链接 程序 时 ， 相 应 的 地 址 就 会 保存 在 主 程序 模块 中 的 交叉 引用 
表 中 。 

MyProg.exe 

( 主 程序 ) 


CALL ProcA 


CALL ProcC 
CALL ProcB 





图 8-7 带 有 加 载 时 地 址 解析 功能 的 动态 链接 过 程 


动态 链接 的 方法 有 很 多 优势 。 首 先 ， 如 果 一 个 外 部 模块 要 在 几 个 程序 中 重复 使 用 ， 那么 静 
态 链接 会 使 每 个 程序 都 包含 这 个 模块 的 一 个 副本 。 很 明显 ， 对 同样 的 代码 保存 多 个 副本 是 对 磁 
空间 的 极 大 浪费 ， 因 此 ， 可 以 通过 运行 时 链接 节省 磁盘 空间 。 动 态 链接 的 第 二 个 优势 是 ， 如 果 
某 个 外 部 模块 的 代码 发 生 改变 ， 则 和 这 个 模块 链接 的 其 他 模块 不 需要 通过 重新 链接 来 保证 程序 的 
完整 性 。 此 外 ， 跟 踪 哪 些 模 块 都 使 用 了 哪些 特定 的 外 部 模块 是 十 分 困难 的 ， 对 于 大 型 系统 甚至 是 
不 可 能 的 。 第 三 个 优势 是 动态 链接 使 得 第 三 方 可 以 构建 公共 库 ， 并 提供 给 为 特定 系统 编写 程序 的 
人 来 使 用 。 换 名 话说， 如 果 你 正 为 某 个 特定 操作 系统 编写 程序 ， 则 某 些 特定 的 动态 链接 库 在 运行 
这 种 操作 系统 的 每 台 计 算 机 都 是 可 以 使 用 的 。 你 不 需要 关心 操作 系统 的 版 本 号 、 补 丁 类 型 或 其 他 
任何 容易 频繁 改变 的 模块 。 只 要 不 删除 该 动态 链接 库 ， 它 就 能 被 动态 链接 所 使 用 。 
动态 链接 可 以 在 程序 加 载 时 进行 ， 也 可 在 运行 的 程序 首次 调用 未 链接 的 模块 时 进行 。 在 加 载 
时 进行 动态 链接 会 引发 程序 的 启动 延迟 。 除 了 简单 地 从 硬盘 中 读 取 二 进 制 代 码 并 运行 之 外 ， 操 作 
系统 不 仅 需要 加 载 主 程序 ， 还 需要 加 载 主 程序 所 使 用 的 其 他 模块 的 二 进 制 代码 。 加 载 器 在 程序 执 
行 之 前 为 主 程序 中 的 每 个 模块 都 提供 了 加 载 地 址 。 用 户 调用 程序 和 程序 实际 开始 运行 之 间 的 延迟 
对 于 某 些 应 用 可 能 是 无 法 接受 的 。 另 一 方面 ， 运 行 时 链接 不 会 引发 启动 延迟 ， 因 为 一 个 模块 仅 在 
调用 时 被 链接 。 当 调用 相对 较 少 的 程序 模块 时 ， 这 种 方法 节省 了 相当 大 的 工作 量 。 然 而 ， 当 一 个 
正在 运行 的 程序 频繁 地 暂停 以 加 载 库 程序 时 ， 会 造成 一 些 用 户 对 于 不 稳定 响应 时 间 的 不 满 。 
动态 链接 库 中 一 个 不 易 察 觉 的 问题 是 编写 模块 的 程序 员 无 法 直接 控制 动态 链接 库 中 的 内 
容 。 因 此 ， 如 果 动 态 链接 库 代码 的 设计 者 决定 更 改 库 的 功能 时 ， 他 们 可 直接 修改 ， 无 须 告知 该 
动态 链接 库 的 使 用 者 。 此 外 ， 任 何 一 个 商用 程序 的 开发 者 都 会 告诉 你 ， 动 态 链接 库 哪怕 发 生 细 
微 的 更 改 ， 都 有 可 能 造成 整个 系统 的 连锁 反应 。 这 些 连锁 反应 可 能 是 破坏 性 的 ， 并 且 很 难 追 踪 
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到 源头 。 万 幸 的 是 ， 这 种 情况 发 生 的 概率 很 低 ， 因 此 ， 动 态 链接 库 仍 然 是 用 于 商用 库 代 码 发 布 
的 主要 方法 。 


8.4.4 编译 器 

汇编 语言 程序 可 以 完成 很 多 高 级 语言 不 能 完成 的 功能 。 首 先 ， 汇 编 语 言 使 得 程序 员 可 以 直 
接 访问 底层 机 器 结构 。 用 来 控制 和 与 外 设 进行 通信 的 程序 一 般 都 是 通过 汇编 语言 编写 的 ， 原因 
是 一 些 特殊 指令 是 定制 的 ， 只 能 在 汇编 语言 中 使 用 ， 不 能 在 高 级 语言 中 使 用 。 例 如 ， 程 序 员 不 
一 定 要 借助 操作 系统 的 服务 才能 控制 一 个 通信 端口 。 利 用 汇编 语言 ， 程 序 员 可 以 使 机 器 执行 一 
些 操作 系统 服务 不 支持 的 功能 。 特 别 是 ， 程 序 员 可 以 使 用 汇编 语言 去 操控 一 些 专用 硬件 ， 因 为 
高 级 语言 的 编译 器 并 不 能 处 理 非 通用 的 设备 。 此 外 ， 高 效 的 汇编 代码 具有 快速 的 执行 速度 。 通 
过 对 每 一 条 汇编 指令 进行 精心 设计 ， 可 以 使 得 汇编 程序 在 系统 上 实时 、 高 效 地 执行 。 

然而 ， 上 述 优势 并 不 足以 说 明 也 可 以 使 用 汇编 语言 进行 通用 应 用 程序 的 开发 。 因 为 ， 事 实 
上 使 用 汇编 语言 进行 编程 是 十 分 困难 的 ， 并 且 容 易 出 现 错误 。 此 外 ， 汇 编 代 码 的 维护 比 开 发 更 
加 困难 ， 特 别 是 如 果 程 序 维护 者 并 不 是 代码 编写 者 的 时 候 。 更 重要 的 是 ,汇编 程序 在 不 同 的 机 
器 结构 上 不 具有 可 移植 性 。 基 于 上 述 原 因 ， 大 多 数 通 用 系统 软件 仅 包含 少量 的 汇编 指令 。 仅 当 
必须 使 用 的 时 候 才 编写 汇编 代码 。 

当今 ， 几 乎 所 有 的 系统 软件 和 应 用 软件 都 无 一 例外 地 使 用 高 级 语言 进行 编写 。 当 然 ,“ 高 级 ” 
很 容易 产生 误解 ， 它 是 一 个 相对 的 概念 。 一 个 广泛 接受 的 编程 语言 分 类 法 是 , “第 一 代 ” 计 算 机 
语言 (1GL ) 为 二 进 制 机 器 代码 。16GL 的 程序 员 通 过 系统 终端 上 的 拨 动 开关 将 程序 输入 到 机 器 中 ! 
具有 更 高 特权 的 用 户 则 将 二 进 制 指令 通过 打 孔 的 方式 记录 在 纸 带 或 卡片 上 。 当 20 世纪 50 年 代 早 
期 第 一 个 汇编 器 出 现 后 ， 编 程 效 率 大 幅 提 升 。“ 第 二 代 ” 语 言 (2GL) 能 够 避免 人 工 将 指令 翻译 为 
机 絮 码 时 产生 的 错误 。 第 二 次 编程 效率 的 飞跃 来 自 于 20 世纪 30 年代 后 期 可 编译 符号 化 语言 的 出 
现 ， 也 称 为 “第 三 代 ” 语 言 (3GL)。Fortran 是 第 一 个 这 类 语言 ， 由 John Backus 和 他 在 IBM 的 团 
队 在 1957 年 发 布 的。 自从 这 一 年 以 后 ， 大 量 的 以 字母 表示 的 3GL 编程 语言 应 运 而 生 。 它 们 的 名 
字 有 时 是 首 字 母 缩 写 ， 如 COBOL、SNOBOL 以 及 COOL; 有 时 是 使 用 人 名 来 命名 的 ， 如 Pasca 和 
Ada。 当 然 , 3GL 更 多 的 时 候 是 由 他 们 的 设计 者 来 命名 的 ， 如 C、C++ 和 Java。 

每 一 代 编 程 语言 都 更 贴近 人 类 思考 问题 的 方式 ， 换 句 话 说 ， 也 就 是 更 远离 机 器 求解 问题 的 
方法 。 一 些 第 四 代 和 第 五 代 编程 语言 使 用 起 来 十 分 简单 ， 以 至 于 原先 需要 由 一 个 经 过 训练 的 专 
业 程 序 员 才 能 完成 的 任务 ， 现 在 可 简单 地 由 终端 用 户 来 完成 ， 只 需要 告诉 机 器 做 什么 ， 至 于 怎 
么 做 则 全 部 由 编译 器 完成 。 在 降低 用 户 编 程 难度 的 同时 ， 这 些 较 晚 出 现 的 编程 语言 无 疑 加 重 了 
计算 机 系统 的 负担 。 从 根本 上 来 说 ， 所 有 的 指令 都 必须 经 过 所 有 的 语言 层次 ， 因 为 计算 机 底层 
的 硬件 实际 上 只 能 执行 二 进 制 指令 。 

在 第 4 章 ， 我 们 兽 经 提 到 汇编 语言 和 机 器 实际 运行 的 二 进 制 代码 之 间 是 一 对 一 的 关系 。 在 
可 编译 的 高 级 语言 中 ， 则 是 一 对 多 的 
关系 。 例 如 ， 因 为 允许 变量 存储 定 
义 ， 所 以 对 于 高 级 语言 中 的 语句 x = 
3*y， 在 MARIE 汇编 语言 中 至 少 有 
12 条 语句 。 源 代码 指令 与 机 器 语言 指 
令 的 比例 越 小 ， 则 说 明 该 源 语言 越 复 
杂 。 对 于 越 高 级 的 语言 ， 每 行程 序 将 第 二 代 编 程 语言 (汇编 代码 ) 
生成 更 多 的 机 器 指令 。 上 述 关系 中 编 第 一 代 编 程 语言 ( 二进制 机 器 码 ) 
程 语言 的 层次 结构 ， 如 图 8-8 所 示 。 ”< 指数 日 ”一 

自从 第 一 代 编 译 器 在 20 世纪 50 图 8-8 程序 语言 的 层次 结构 





( 自然 语言 
第 四 代 编 程 语 言 
(SQL、LISP 等 ) 
第 三 代 编 程 语 言 
(Java、C、C++、Fortran、COBOL 等 ) 












号 游 昏 站 “号 游 此 入 险 服 量 关节 浴 答 其 起 4 人 旱季 出 绊 刀 闪避 “ 切 绚 上手 埠 4 簿 中 蝇 契 影 到 
信服 墨 01-8 园 “再 胜 次 撒 线 章 巩 关 滨 
王 避 隶 改 “ 许 符 奋 且 凤 妆 贞 得 内 哈 有 时 噬 计 痢疾 量 坦 4 
人 ep 省 曙 “ 三 羔 噬 阅 肯 于 号 工 出 对 旦 要 一 玫 骨 时 并 神 群 兴 各 
巡 册 孙 “Y 对 关 小 隆起 在 录 马 “ 阁 引 器 振东 藉 旱 际 调 其 
一 富力 韦 工 一 人 “及 洪 如 虱 革 虱 d 昱 9 和 在 泛 十 应 
“+ , 闪 ,。= , 下属 劝 阔 蜗 址 境 “ 山 滋 "4d=D+g=V 
绕 “ 甸 哮 洪 户 有 昌 梁 非 梁 属 前 六 而 坪 示 “前 时 认 影 外包 
赂 “ 寺 重 氏 于 埠 灶 中 闪 各 此 壬 小 一 咱 刍 丹 址 境 淫 幢 “ 年 

各 录 晶 列 下 亚 交 形 导 出 半 如 我 中 嵌 汽 晶 赋 计量 坦 看 

“小 十 01-8 国 绕 和 峡 浴 绢 虹 朋 卫 加 胃 洁 让 








1U9UIAed 


Tedrourdquour 


(aq3ex3sexe3uT * spueTeg5ufpPUeq3s3no) - 3ueuAed = Tedtoutxzdu3uou 
: 岂 旱 半 局 水 年 “ 呵 队 “于 这 半 了 关 比 雪夫 在 仙 且 掉 本 当中 阳 嵌 用 
是 习 俱 王 “ 壁 表 噬 并 计 内 爱 寻 踢 内 天 者 关东 清 一 形 辜 学 尿 “ 坦 直 交替 妙 汽 是 比 护 限 轿 丙 拒 


小 所 -9 关中 天 站 超 影 大 夭 6-8 国 







昏 计 站 妙 


0 JAOLS 


0V 
V0 ddv 









什 对 全 中 
09+g=V 


ey 
内 给 搬 


+8=Y 
尘世 责 Re] 
器 


替 妈 
梁 妇 此 事 始 世 夷 永 召 闻 丹 开化 了 “ 旋 影 梁 世 隆 名 太 猴 肖 旷 “ 亲 闻 去 次 1 绰 烤 落 看 漠 及 本 许 
铁 国 “ 宣 昧 潍 革 下 开 区 并 中 旦 洁 阁 季 半 于 人 edsAedlT 下 浙 扩 XX 尺 二 圭 “ 由 办“ 旋 影 潍 轩 书 江 了 i 
“ 几 明 志 明了 腹 读 梁 半 上 人 隆 有 中 钳 秆 没 甘 和 挟 “ 酸 张 甸 丫 巡 最 对 虹 世 丙 声 巡 “( 落 次 困 邮 攻 青 淖 ) 
世 责 虹 关 型 村 峙 上 电 国 举 各 城 沙 寻 “ 滋 玫 举 各 坟 沙 一 工 避 性 江 “ 几 国 妥 典 世 夷 辟 鲜 球 右 坪 攻 涂 
岂 “ 针 耳 走 浙 肌 XX 江村 圭 上 (LZ C1 “由 网 ) 去 阁 “未 莫如 志 丫 如 摆 傅 “( 匾 35T3 “JT“ 果 队 ) 
去 昌 谢 展 寿 并 旦 时 火 一 甲 辐 丙 击 寻 “ 茹 丙 错 “ 举 中 是 时 开关 晤 归 四 辣 时 中 阴 冰 关于 吉 小 放 醒 
了 庆 目 坚 “ 夫 区 妥 喇 关 允 种 一 禹 “ 光 地 68 因果“ 乔 站 艳 眼 阁 中 小 和 押 -9 位 靶 囊 开 昌 尹 娄 学 
“也 饶 汪 是 天 国之 节 时 了 关 在 王 绰 插 吕 夫 与 东 量 庆 夫 枉 碍 共 
线 Y 此 央 局 二 孙 间 了 天 路 回 “ 竺 绰 关 冀 笃 当 娠 关 沙 等 柳 加 半 主 糙 录 十 米 郡 星 录 器 诈 洗 工 用 亚 
吞 工 材 阁 “ 驴 家 及 玫 准 坦 中 玻 坦 器 下 由 壬 响 央 “ 谢 名 洲 计 与 此 凡 志 坪 而 浊 路 “ 当 隆 四 府 绍 守 击 





SpE 材 痊 蜂 光 


346 ”第 8 章 





的 第 一 步 是 通过 语法 树 构 建 伪 汇编 代码 。 这 个 代码 通常 称 为 三 地 址 代码 ， 因 为 它 支 持 大 多 数 汇 
编 语言 不 支持 的 语句 ， 如 A =B +C。 这 个 中 间 代 码 使 得 编译 器 可 以 移植 到 不 同 的 计算 机 之 上 。 

一 旦 分 词 、 建 立 语法 树 以 及 语义 分 析 全 部 完成 ， 则 构建 一 个 三 地 址 代码 翻译 器 以 输出 指令 
集 将 是 一 个 相对 简单 的 任务 。 大 多 数 系统 的 指令 集体 系 结构 使 用 的 都 是 双 地 址 代码 ， 因 此 寻 址 
模式 的 不 同 必须 在 翻译 阶段 进行 解决 。( 回顾 可 知 ，MARIE 指令 集 是 单 地 址 结构 。) 然 而 ， 最 终 
的 编译 器 阶段 除了 将 中 间 代 码 翻译 为 汇编 代码 之 外 ， 通 常 还 需要 做 很 多 的 工作 。 高 效 的 编译 器 
会 做 一 些 代码 优化 的 工作 ， 如 考虑 不 同 的 存储 器 和 寄存 器 组 织 结构 以 及 应 用 最 强大 的 指令 去 执 
行 任务 。 代 码 优化 工作 还 涉及 去 除 不 必要 的 临时 变量 、 删 除 重复 表达 式 以 及 去 除 死 ( 无 法 到 达 
的 ) 代 人 码 。 

当 产 生 所 有 指令 并 且 进 行 了 相应 的 优化 后 ， 编 译 器 生成 二 进 制 目标 代码 ， 通 过 链接 即 可 在 
目标 系统 上 运行 。 


8. 4.5 解释 器 

与 编译 型 语言 类 似 ， 解 释 型 语言 在 源 代 码 语句 和 可 执行 机 器 指令 间 也 具有 一 对 多 的 关系 ， 
然而 ， 不 像 编 译 器 在 生成 二 进 制 代 码 前 需要 读 和 整个 源 文 件 ， 解 释 器 每 次 处 理 1 条 源 代 码 
语句 。 

因为 很 多 工作 需要 在 “运行 中 ”完成 ， 所 以 解释 器 的 速度 要 慢 于 编译 带 。 在 编译 带 所 过 
六 步 中 至 少 有 五 步 也 是 解释 器 所 需要 的 ， 并 且 这 些 步骤 是 “实时 ”执行 的 。 因 此 ， 解 释 需 无 
法 进行 代码 优化 。 此 外 ， 解 释 器 中 的 错误 检测 仅 限 于 语法 检查 和 变量 类 型 检查 。 例 如 ， 很 少 有 
解释 器 能 够 在 发 生前 检测 出 非法 的 算术 操作 或 在 数组 越界 前 对 程序 员 发 出 警告 。 

一 些 早 期 的 解释 器 可 在 定制 的 编辑 器 中 提供 语法 检查 。 例 如 ， 如 果 用 户 将 “else” 输 入 
为 “esle”， 则 编辑 器 会 立即 添加 一 个 备注 。 其 他 解释 器 允许 用 户 使 用 通用 的 文本 编辑 器 ， 将 
语法 检查 工作 放 到 运行 时 中 完成 。 后 一 种 方法 对 于 企业 级 应 用 程序 来 说 是 十 分 危险 的 。 如 果 应 
用 程序 恰好 执行 一 条 未 进行 过 语法 检查 的 分 支 语句 时 ， 则 可 能 造成 仅 有 部 分 文件 被 更 新 而 导致 
程序 崩溃 ， 倒 霉 的 程序 员 将 会 上 着 一 个 看 起 来 很 奇怪 的 系统 命令 行 。 

尽管 存在 执行 速度 缓慢 和 错误 检测 延迟 等 问题 ， 但 解释 型 语言 仍然 有 很 多 好 处 。 首 先 ， 解 
释 型 语言 支持 源码 级 调试 ， 这 十 分 适合 初级 程序 员 和 终端 用 户 。 这 就 是 为 什么 在 1964 年 两 个 
达 特 茅 斯 的 教授 John G. Kemeny 和 Thomas E. Kurtz， 发 明了 Basic ( 面向 初学 者 的 通用 符号 化 指 
令 代 码 ) 。 在 那个 时 候 ， 学 生 所 编写 的 第 一 个 程序 就 是 在 80 列 的 卡片 上 通过 打 孔 来 描述 Fortran 
间 令 。 这 些 卡 片 需要 主机 编译 器 才能 运行 ， 这 将 花费 几 个 小 时 的 时 间 。 有 时 ， 彻 底 的 编译 和 执 
行 要 花费 几 天 的 时 间 。 与 批 处 理 模式 中 进行 语句 编译 不 同 ，Basie 允许 学 生 在 一 个 交互 式 终端 
中 输入 程序 语句 。 始 终 在 主机 中 运行 的 Basic 解释 器 将 会 立即 将 反馈 信息 发 给 学 生 。 这 样 ， 学 
生 可 以 快速 地 更 正 语法 和 逻辑 错误 ， 因 此 获得 了 更 好 的 学 习 体 验 。 

因为 这 些 原因 ，Basic 是 最 早期 个 人 计算 机 系统 的 首选 语言 。 许 多 第 一 次 购买 计算 机 的 人 
并 不 是 有 经 验 的 程序 员 ， 因 此 他 们 需要 一 种 简单 易学 的 编程 语言 。Basic 则 是 最 理想 的 选择 。 
此 外 ， 在 一 个 单 用 户 个 人 系统 上 ， 很 少 有 人 关心 解释 型 Basic 会 比 编译 型 语言 慢 。 


8.5 Java: 以 上 全 部 


在 20 世纪 90 年 代 早 期 ，Sun Microsystems 的 James Gosling 博士 和 他 的 团队 试图 开发 一 种 可 
运行 于 任意 计算 平台 的 编程 语言 ， 即 “ 仅 需 编写 一 次 ， 就 可 在 任意 机 器 上 运行 ”的 计算 机 语 
言 。 到 了 1995 年 ，Sun 发 布 了 Java 编程 语言 的 第 一 版 。 由 于 它 的 可 移植 性 和 开放 性 规范 ，Jave 
已 经 成 为 最 流行 的 编程 语言 。Java 代码 本 质 上 可 以 在 所 有 的 计算 机 平台 上 运行 ， 从 最 小 的 手持 
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设备 到 大 型 计算 机 。Java 的 出 现 正 是 最 佳 时 机 :- 它 是 一 个 跨 平台 的 语言 ， 可 以 部 署 在 很 多 基于 
因特网 的 商业 网 站 上 ， 可 以 说 是 完美 的 跨 平台 计算 模型 。 虽 然 在 第 5 章 中 已 经 对 Java 及 其 特征 
进行 了 简要 介绍 ， 但 现在 要 讨论 更 多 的 细 市 。 

学 习 过 Java 编程 语言 的 人 都 知道 Java 编译 右 的 输出 是 一 个 二 进 制 字 节 码 文 件 。 这 个 字 节 
码 文件 由 Java 虚拟 机 (JVM) 执行 ， 其 在 很 多 方面 都 很 像 一 个 真实 的 计算 机 。JVM 拥有 可 由 机 
器 中 运行 的 进程 寻 址 的 私有 存储 器 空间 。 它 还 有 自己 的 指令 集体 系 结构 。 该 指令 集结 构 基 于 堆 
栈 结构 ， 保 证 了 JVM 的 简洁 性 ， 并 可 移植 到 任何 计算 机 平台 上 。 

当然 ，Java 虚拟 机 并 不 是 真实 的 计算 机 。 它 是 位 于 操作 系统 和 应 用 程序 之 间 的 一 个 软件 
层 : 即 二 进 制 字 节 码 文件 。 字 节 码 文件 包含 了 变量 以 及 处 理 这 些 变量 的 方法 (程序 ) 。 

图 8-11 说 明了 拥有 自己 的 存储 器 和 方法 区 的 JVM 是 什么 样 的 一 台 计 算 机 器 。 值 得 注意 的 
是 存储 堆 区 ， 方 法 代码 区 和 “本 地 方法 接口 ”区 由 机 器 中 运行 的 所 有 进程 共享 。 





本 地 方法 区 ( 连接 用 其 他 
语言 所 编写 的 程序 的 接口 ) 





图 8-11 Java 虚拟 机 


存储 堆 是 在 线程 中 当 创建 和 撤销 某 些 数据 结构 时 在 主 存 中 分 配 和 释放 的 存储 空间 。Java 中 
存储 堆 的 释放 指 的 是 垃圾 回收 ， 这 是 由 JVM( 替代 操作 系统 ) 自动 执行 的 。Java 的 本 地 方法 区 为 
Java 以 外 的 二 进 制 目标 文件 (如 已 编译 完成 的 C++ 模块 或 汇编 语言 模块 ) ， 提 供 了 工作 区 。 
JVM 的 方法 区 包含 了 在 JVM 中 运行 每 个 应 用 线程 所 需 的 二 进 制 代码 。 这 些 二 进 制 代码 又 包含 
了 类 变量 数据 结构 和 程序 声明 。Java 可 执行 程序 的 语句 保存 在 一 个 名 为 字 节 码 的 中 间 代 码 中 ， 
我 们 在 第 5 章 中 介绍 过 它 。 

Java 方法 的 字 节 码 可 在 各 种 线程 中 执行 。 一 些 线程 由 JVM 自动 开启 执行 ， 主 程序 线程 就 
是 其 中 之 一 。 在 每 个 线程 中 一 次 只 能 调用 一 个 方法 ， 并 且 程 序 可 能 会 生成 很 多 额外 线程 来 提供 
并 发 性 。 当 一 个 线程 调用 一 个 方法 时 ， 它 就 为 这 个 方法 创建 了 一 个 存储 帧 。 这 个 存储 帧 的 一 部 
分 用 来 存储 方法 的 局 部 变量 ， 其 他 部 分 是 自己 的 私有 栈 。 当 一 个 线程 定义 了 方法 栈 之 后 ， 它 将 
方法 中 的 参数 进行 压 栈 ， 并 将 该 线程 的 程序 计数 器 指向 该 方法 的 第 一 条 可 执行 语句 。 

每 个 Java 类 都 包含 一 种 类 型 的 符号 表 ， 这 种 符号 表 称 为 常量 池 ， 它 是 一 个 包含 信息 的 矩 
阵 ， 这 些 信息 包括 每 类 变量 的 数据 类 型 、 初 始 值 以 及 访问 标记 ( 如 这 个 变量 对 于 类 来 说 是 公有 
的 还 是 私有 的 ) 等 。 此 外 ,常量 池 还 包含 了 一 些 非 用 户 定义 的 数据 结构 。 这 就 是 为 什么 Sun Mi- 
crosystems 称 常 量 池 中 的 条 目 (矩阵 元 素 ) 为 属性 。 在 每 个 Java 类 的 众多 属性 中 ， 有 一 个 家 政 项 
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目 如 Java 源 文件 的 名 字 ， 该 类 的 继承 层次 以 及 指向 其 他 JVM 内 部 数据 结构 的 指针 等 信息 。 
通过 图 8- 12 所 示 的 一 个 Java 程序 来 - | 
说 明 JVM 是 如 何 执行 方法 的 字 节 码 的 。 | PDT Sa ea。 








public static void main (String[ ] args) { 
Java 将 这 个 类 的 源 代 码 保 存在 名 为 int i = 0; 
Simple.java 的 文本 文件 中 。Java 编译 0 2 { 
器 读 取 Simple. java， 并 执行 和 其 他 编 i=i+1l; 
译 器 一 样 的 工作 。 编 译 器 的 输出 是 名 为 pe 
Simple.class 的 二 进 制 字 节 码 文件 流 。 } // main() 
simple .class 文件 能 在 版 本 号 高 于 编译 [1 人"!e0 





器 版 本 的 任何 JVM 上 运行 。 上 述 步骤 如 


图 8-13 所 示 图 8-12 一 个 简单 的 Java 程序 





图 8-13 ”Java 类 的 编译 和 执行 

在 执行 时 ，Java 虚拟 机 必须 运行 在 主机 系统 上 。 当 JVM 加 载 一 个 类 文件 时 ， 所 做 的 第 一 件 
事 就 是 验证 字 节 码 的 完整 性 (这 是 通过 检查 类 文件 格式 来 完成 的 ) ， 然 后 检查 字 节 码 指 令 的 格 
式 ， 并 确认 没有 非法 的 引用 存在 。 在 这 个 初始 验证 成 功 完成 后 ， 加 载 器 在 将 字 节 码 放 和 人 内 存 的 
同时 ， 执 行 一 系列 的 运行 时 检测 。 

在 所 有 的 验证 都 完成 后 ， 加 载 器 调用 字 节 码 解 释 器 。 这 个 解释 器 将 执行 6 步 操作 : 

. 通过 要 求 加 载 器 提供 所 有 尚未 加 载 的 引用 类 和 系统 库 ， 执 行 字 节 码 的 链接 操作 。 
. 创建 和 初始 化 主 函 数 的 栈 帧 和 局 部 变量 。 

. 创建 并 执行 线程 。 

. 当 在 线程 执行 时 ， 通 过 释放 未 使 用 的 存储 资源 对 堆 存 储 进 行 管理 。 

. 当 每 个 线程 都 执行 结束 后 ， 释 放 它 所 占用 的 资源 。 

. 当 整 个 程序 执行 完成 后 ， 终 止 剩余 的 线程 和 JVM。 

图 8-14 显示 了 Simple.class 字 节 码 的 十 六 进 制 镜像 。 每 个 字 节 的 地 址 由 第 1 列 ( 阴 影 
部 分 ) 的 值 加 上 第 1 行 ( 阴 影 部 分 ) 的 偏 移 量 来 获得 。 为 方便 起 见 ， 如 果 字 节 码 是 有 意义 的 7 位 
ASCI 值 时 ， 就 将 其 翻译 成 字符 。 可 以 看 到 源 文件 的 名 字 是 Simple. java， 它 开始 于 地 址 
0x06D 处 。 类 的 名 字 开 始 于 地 址 0x080。 熟 悉 Java 的 读者 还 知道 Simple 类 是 .this 类 ， 它 的 
超 类 java .1ang .Object 开始 于 地 址 0x089 处 。 

值得 注意 的 是 类 文件 以 十 六 进 制 数 CAFEBABE 开头 。 这 个 数 是 一 个 用 于 表明 类 文件 开始 
的 魔 数 。 紧 跟 在 魔 数 之 后 的 8 字 节 序列 表明 了 类 文件 的 语言 版 本 。 如 果 这 个 序列 数 比 JVM 解释 
器 所 支持 的 版 本 号 大 ， 则 验证 器 终止 JVM 的 执行 。 

可 执行 的 字 节 码 从 地 址 0x0E6 处 开始 。 在 地 址 0x0E5 处 的 十 六 进 制 数 16 通知 解释 器 可 执 
行 方法 的 字 节 码 长 度 为 22 字 节 。 在 汇编 语言 中 ， 每 个 可 执行 的 字 节 码 都 对 应 一 个 助 记 符 。 目 
前 ，Java 定义 了 204 个 不 同 的 字 节 码 指 令 。 因 此 ， 操 作 码 仅 需 要 1 字 节 即 可 表示 。 这 些小 的 操 
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作 码 有 利于 控制 类 的 大 小 ,使 其 可 以 更 加 快速 地 加 载 ,， 并且 更 容易 转化 为 主机 上 的 二 进 制 


指令 。 
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图 8-14 simple. class 的 二 进 制 镜像 


因为 在 计算 机 程序 中 某 些 常 量 使 用 得 十 分 频繁 ， 所 以 在 需要 这 些 常量 的 地 方 定义 了 一 些 特 
定 的 字 节 码 。 例 如 ， 助 记 符 iconst_5 表示 将 整 型 数 5 压 和 人 栈 中 。 为 了 将 更 大 的 常量 压 人 栈 ， 
一 般 需 要 两 个 字 节 人 码 ， 第 一 个 表示 操作 ， 第 二 个 表示 操作 数 。 像 我 们 上 面 提 到 的 ， 每 个 类 的 局 
部 变量 保存 在 一 个 矩阵 中 。 一 般 来 说 ， 这 个 矩阵 的 头 几 个 元 素 是 最 活跃 的 ， 因 此 会 存在 特别 指 
向 这 些 初 始 局 部 矩阵 元 素 的 字 节 码 。 对 该 矩阵 其 他 元 素 的 访问 则 需要 2 字 节 指令 : 第 一 个 字 节 
表示 操作 码 ， 第 二 个 字 节 表示 和 矩阵 元 素 相对 和 矩阵 首 地 址 的 偏 移 。 

就 像 所 说 的 那样 ， 让 我 们 来 看 一 下 Simple.class 中 main () 方 法 对 应 的 字 节 码 。 从 
图 8-14 中 抽取 出 main () 对 应 的 字 节 码 ， 并 配 以 助 记 符 和 一 些 注释 ， 如 图 8-15 所 示 。 最 左面 的 
一 列 给 出 了 每 条 指令 的 相对 地 址 。 线 程 专用 的 程序 计数 器 使 用 这 个 相对 地 址 控制 程序 流 。 我 们 
通过 跟踪 字 节 码 的 执行 来 了 解 程序 是 如 何 工作 的 。 

当 解 释 器 开始 运行 这 个 代码 时 ，PC 被 初始 化 为 0， 指 令 iconst_0 被 执行 。 这 条 指令 对 应 
Simple.java 源 代码 中 的 第 3 行 语 句 int i =0;。 然 后 ，PC 值 递 增 1， 逐 条 执行 随后 的 初始 
化 指令 ， 直 到 在 第 4 条 指令 遇 到 goto 语句 。 这 条 指令 将 程序 计数 器 的 值 加 上 十 进 制 的 11， 然 
后 它 变 为 0x0F， 指 向 10ad_1 指令 。 

这 时 候 ，JVM 已 经 为 i 和 j 赋予 了 初 值 ， 并 开始 检查 while 循环 的 初始 条 件 以 判断 是 否 
应 当 执行 循环 体 。 为 了 完成 上 述 工 作 ，JVM 将 守 值 (位 于 局 部 变量 矩阵 中 ) 压 入 栈 中 ， 然 后 将 
比较 值 0x0A 也 压 人 栈 中 。 需 要 注意 的 是 ， 这 时 候 编译 器 已 经 做 了 一 点 点 的 代码 优化 工作 。 默 
认 情 况 下 ，Java 中 的 整 型 数 为 32 位 ， 占 4 字 节 。 然 后 ， 编 译 器 会 发 现 十 进 制 常数 10 仅 需 要 占 
用 1 字 节 ， 因 此 它 生 成 的 代码 仅 将 1 字 节 压 人 栈 中 ， 而 不 是 4 个 字 节 。 

比较 操作 指令 if_icmplt ， 从 栈 中 弹出 i 和 0x0A， 并 对 二 者 进行 比较 ( 助 记 符 末尾 的 1t 
表示 该 比较 操作 小 于 条 件 ) 。 如 果 i 小 于 10， 则 PC 值 将 减 去 0x0B， 从 而 得 到 循环 体 的 起 始 地 
址 7。 当 循环 体 中 的 指令 都 执行 完成 后 ， 则 进入 地 址 0xOF 处 进行 条 件 判 断 。 一 旦 条 件 判断 失 
败 ， 则 解释 器 在 完成 一 些 清理 工作 后 ， 会 将 控制 权 返 还 给 操作 系统 。 








变量 初始 化 

将 整数 0 压 入 数据 栈 上 
把 栈 顶 的 整数 移 到 在 地 址 为 1 的 局 部 变量 数组 中 
将 双 精度 常数 0 压 入 推进 栈 

跳 过 在 随后 两 个 字 节 中 给 出 的 字 节 数 
这 意味 着 我 们 将 跳 过 11 字 节 
这 意味 着 加 0B 到 程序 计数 器 中 
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一 
一 | 


把 局 部 数组 的 一 个 整数 值 压 到 栈 上 
下 将 整数 1 压 入 淮 术 
iada 把 栈 项 的 两 个 整数 操作 数 相 加 (将 总 和 压 进 栈 ) 


istore 1 把 整数 从 栈 顶 移 到 在 地 址 为 1 的 局 部 变量 数组 中 


Es Er re 从 局 部 数组 中 取出 双 精度 变量 并 放 到 栈 
a 将 模 顶 的 两 个 双 精 度 值 进行 相 加 
i 把 栈 顶 的 双 精 度 总 和 存 到 局 部 变量 数组 的 位 置 2 中 


循环 条 件 


iload 1 从 局 部 变量 数组 的 位 置 1 处 取 整 数 
bipush RX 


RO tr ee ee hi 
ROOT 


| FF 如 果 (i<10) 为 真 ， 将 后 面 的 值 加 到 程序 计数 器 
Ms F5 注意 : FFF5 = -11 (十 进 制 ) 


图 8-15 Simple.class 带 注释 的 字 节 码 


想 了 解 解释 器 是 如 何 获 知 源 代码 中 的 哪 行 语句 引起 了 程序 的 崩 演 的 Java 程序 员 会 发 现 答案 
就 在 图 8-14 所 示 的 二 进 制 类 文件 镜像 中 的 地 址 0x108 处 。 它 是 行 数 表 的 起 始 位 置 ， 行 数 表 建 立 
了 程序 计数 值 和 源 程序 中 特定 行 之 间 的 对 应 关系 。 从 地 址 0x106 开始 的 两 个 字 节 告知 JVM 在 行 
数 表 中 有 7 个 条 目 。 通 过 填 人 一 些 细节 信息 ,我们 构建 了 交叉 引用 ， 如 图 8-16 所 示 。 

注意 ， 如 果 当 PC =9 的 时 候 程序 骨 溃 ， 则 出 错 的 程序 行 在 第 6 行 。 对 源 代码 第 7 行 所 产生 
的 字 节 码 进 行 解释 是 在 PC 值 大 于 等 于 0x0B 且 小 于 0xOF 的 时 候 。 

因为 JVM 在 加 载 和 执行 字 节 码 时 会 完成 很 多 的 工作 ， 所 以 它 的 性 能 是 比 不 上 编译 型 语言 
的 。 即 使 使 用 Java 的 Just-In-Time( JIT) 编译 器 等 加 速 软 件 ， 其 性 能 的 提升 仍然 十 分 有 限 。 然 
而 ， 性 能 的 损失 带 来 的 却 是 可 在 一 个 平台 上 创建 并 存储 类 文件 ， 并 在 完全 不 同 的 平台 上 运行 。 
例如 ， 我 们 可 以 在 Alpha RISC 服务 器 上 编写 并 编译 Java 程序 ， 然 后 在 CISC Pentium 系列 机 上 下 
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载 类 文件 的 字 节 码 并 运行 。 这 种 “编写 一 次 ， 随 处 可 运行 ”的 范例 给 拥有 很 多 不 同 且 空间 上 
分 离 的 企业 带 来 了 巨大 的 好 处 。Java 小 型 应 用 程序 (可 在 浏览 器 中 运行 的 字 节 码 ) 对 于 基于 网 络 
的 事务 或 电子 商务 是 十 分 必要 的 。 最 终 ， 用 户 所 需要 的 就 是 合理 地 运行 当前 的 浏览 器 。 可 移植 
性 和 相对 易 用 性 使 得 Java 语言 和 它 的 虚拟 机 环境 成 为 了 理想 的 中 间 件 平台 。 


bd 
计数 器 | 的 行 数 


public class Simple { 
public static void main (String[] args) { 
nt 二 和 0 
double 3 三 905 
while (i < 10) { 
,es 









} // while 
} // main() 
} // Simple() 


DovVmnwm 必 mwNbP 











图 8-16 Simple.class 中 程序 计数 值 与 代码 行 数 的 对 应 关系 


8.6 数据 库 软 件 

到 目前 为 止 ,一 个 企业 最 宝贵 的 资源 不 是 办 公 室 或 工厂 ， 而 是 它 所 拥有 的 数据 。 不 论 企业 
的 性 质 是 私营 企业 、 教 育 机 构 还 是 政府 ， 它 们 的 历史 记录 和 当前 形态 都 可 由 它们 所 拥有 的 数据 
来 呈现 。 如 果 数 据 与 企业 形态 不 一 致 ， 或 者 数据 本 身 就 不 一 致 ， 则 这 些 数据 的 价值 就 十 分 可 
颖 ， 也 就 产生 了 相应 的 问题 。 

-个 企业 的 任何 计算 机 系统 都 是 支持 众多 相关 软件 的 平台 。 这 些 程序 根据 企业 形态 的 变化 
更 新 数据 。 这 些 相关 程序 通常 称 为 应 用 系统 ， 因 为 它们 作为 一 个 整体 进行 工作 : 很 少 有 程序 仅 
靠 自 身 就 可 以 应 用 系统 组 件 共享 相同 的 数据 集 ， 并 且 可 以 共享 相同 的 计算 环境 ， 但 这 不 是 必需 
的 。 当 前 ， 应 用 系统 会 使 用 很 多 平台 : 台式 计算 机 、 文 件 服务 器 或 大 型 计算 机 。 随 着 基于 网 络 
的 计算 的 兴起 ， 有 时 我 们 并 不 知道 ， 甚 至 不 关心 应 用 运行 在 什么 平台 之 上 。 虽 人 然 每 种 平台 会 》 
数据 管理 带 来 自己 独特 的 优势 和 挑战 ， 但 数据 库 管理 软件 的 基本 概念 在 这 30 多 年 间 并 没有 太 
多 的 改变 。 

早期 的 应 用 系统 使 用 磁带 或 打 孔 卡 记录 数据 。 基 于 磁带 和 打 孔 卡 的 串 行 特 征 ， 为 了 获得 更 
高 的 处 理 效率 ,它们 通常 借助 批 处 理 方式 成 组 运行 。 因 为 磁盘 上 的 任何 数据 元 素 都 是 可 以 直接 
访问 的 ， 所 以 依靠 平面 文件 的 批 处 理 更 新 不 再 是 系统 结构 必须 要 求 的 。 然 而 ， 很 难 取代 传统 处 
理 方式 ,而 且 重 新 编写 程序 的 成 本 也 很 高 。 因 此 ， 在 大 多 数 读 卡 器 已 经 退出 历史 舞台 后 ,平面 
文件 处 理 方式 仍然 延续 了 很 多 年 。 

在 平面 文件 系统 中 ， 每 个 应 用 程序 都 可 以 随意 定义 任何 它 所 需要 的 数据 对 象 。 正 是 由 于 这 
个 原因 ， 很 难保 证 系统 的 一 致 性 。 例 如 ， 有 一 个 收 账 系统 用 于 跟踪 哪些 人 拖欠 了 钱 以 及 拖欠 了 
多 久 。 生 成 月 度 发 票 的 程序 可 能 在 一 个 名 为 CUST_OwE 的 6 位 字段 中 (或 数据 元 素 ) 记录 月 度 
事务 ， 而 进行 月 度 对 账 的 人 可 能 恰巧 调用 cCUST_BAL 字段 ， 并 且 认 为 该 字段 是 5 位 宽 。 几 乎 可 
以 确定 的 是 一 些 信 息 会 丢失 ， 并 产生 混乱 。 到 了 这 个 月 的 某 个 时 候 ， 会 出 现 还 有 几 千 美元 “还 
未 和 人 账 ” 的 问题 之 后 ， 调 试 人 员 最 终 发 现 CUST_OWE 和 cUST_BAL 具有 相同 的 数据 元 素 ， 这 
个 问题 是 由 于 字段 中 数据 的 截取 或 溢出 引起 的 。 

数据 库 管 理 系统 (DBMS ) 的 出 现 避 免 了 上 述 问题 。 它 们 强制 保证 基于 文件 的 应 用 系统 的 顺 
序 和 一 致 性 。 数 据 库 系统 出 现 后 ， 程 序 员 不 能 随意 地 以 他 们 喜好 来 描述 和 访问 数据 元 素 。 此 
时 ， 在 数据 库 管 理 系统 中 ， 有 且 仅 有 一 种 数据 定义 方式 。 这 个 定义 就 是 系统 的 数据 库 视 图 。 在 
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一 些 系统 中 ， 会 对 程序 所 看 到 数据 库 ( 即 逻辑 视图 ) 与 计算 系统 所 看 到 的 数据 库 ( 即 物理 视图 ) 
进行 区 分 。 数 据 库 管理 系统 将 数据 库 的 物理 视图 和 逻辑 视图 进行 集成 。 应 用 程序 在 数据 库 管 理 
系统 和 操作 系统 的 控制 下 ， 使 用 数据 库 管 理 系 统 提供 的 逻辑 视图 来 读 取 和 更 新 物理 视图 中 的 数 
据 ， 如 图 8-17 所 示 。 

由 数据 库 视图 定义 的 数据 组 织 为 记录 的 
逻辑 结构 ， 这 些 记 录 组 织 在 一 起 成 为 文件 。 
相关 的 文件 集合 构成 数据 库 。 

数据 库 架 构 师 在 创建 逮 辑 和 物理 视图 时 
会 留心 应 用 及 性 能 的 需求 。 一 般 的 目标 是 ， 
在 保证 性 能 (通常 用 应 用 啊 应 时 间 来 衔 量 ) 的 
同时 ， 最 小 化 访问 延迟 ， 并 且 避 免 空 间 浪 
费 。 例 如 ， 银 行 系统 的 数据 库 不 会 在 已 经 注 
销 的 账户 记录 中 存储 客户 的 名 字 和 地 址 。 这 
些 信息 会 保存 在 一 个 以 账户 号 为 主键 的 账户 
主 文件 中 。 然 后 ， 每 个 注销 的 账户 将 具有 唯 
一 一 个 账户 号 以 及 相关 信息 。 

数据 库 管 理 系统 有 多 种 物理 数据 的 组 织 
形式 。 实 际 上 ， 每 个 数据 库 厂商 都 有 专 有 的 
管理 和 索引 文件 的 方法 。 大 多 数 系 统 使 用 各 
种 B+ 树 数据 结构 。( 详 细 细 节 见 附录 。) 数 图 8-17 数据 库 管 理 器 和 其 他 系统 组 件 之 间 的 关系 
据 库 管 理 系 统 通 常 独 立 于 底层 操作 系统 去 管理 磁盘 存储 器 。 通 过 在 处 理 过 程 中 跳 过 操作 系统 
层 ， 数据库 系 统 根据 数据 视图 和 索引 设计 来 优化 读 写 操作 。 

在 第 7 章 中 ， 我 们 学 习 了 磁盘 文件 的 组 织 结构 。 知 道 大 多 数 磁 盘 系统 都 以 块 为 单位 从 磁盘 
中 读 取 数据 ， 最 小 的 可 寻 址 单位 为 扇 区 。 大 多 数 大 型 系统 一 次 读 取 一 个 完整 的 磁道 。 当 索引 层 
次 比较 深 时 ， 需 要 多 次 读 操作 才能 遍历 索引 树 的 可 能 性 会 大 幅 增加 。 如 何 组 织 树 才 能 减少 磁盘 
IO 的 访问 ? 创建 非常 大 的 内 部 索引 节点 以 便 每 个 节点 可 跨越 多 个 记录 值 ， 这 是 否 是 更 好 的 设 
计 ? 这 样 可 能 使 每 层 的 节点 数目 比较 少 ， 从 而 在 一 次 读 操作 中 就 可 以 访问 整个 树 结构 。 或 者 让 
内 部 节点 变 小 ， 从 而 在 一 次 读 操 作 中 能 够 获得 更 多 层 的 索引 ?所 有 这 些 问 题 的 答案 取决 于 运行 
数据 库 的 系统 环境 ， 最 优 的 答案 甚至 取决 于 数据 本 身 。 例 如 ， 如 果 键 值 是 稀疏 的 ， 也 就 是 如 果 
有 很 多 键 值 不 会 使 用 ， 则 可 能 会 选择 一 种 特定 的 索引 组 织 策略 。 但 如 果 索 引 结构 是 密集 的 ， 则 
可 能 选择 另 一 种 组 织 策略 。 无 论 采 用 什么 实现 方式 ， 数 据 库 调 优 都 是 一 个 不 可 忽视 的 任务 ， 这 
需要 一 个 优秀 的 数据 库 管 理 软 件 、 系 统 的 存储 架构 ， 以 及 系统 管理 数据 的 详细 说 明 。 

数据 库 文件 通常 具有 多 个 索引 。 例 如 ， 客 户 数据 库 可 以 使 用 客户 账户 和 客户 姓名 来 索引 记 
录 。 当 然 ， 每 增加 一 个 索引 都 会 给 系统 带 来 额外 的 负担 ， 不 但 增加 存储 空间 (用 于 存储 索引 )， 
还 会 增加 处 理 时 间 ( 因为 当 增 加 或 删除 记录 时 ， 必 须 马 上 更 新 所 有 的 索引 )。 数 据 库 系 统 设 计 
所 面临 的 主要 挑战 之 一 就 是 如 何在 使 用 足够 多 的 索引 以 加 快 记录 检索 速度 的 同时 ， 又 不 给 系统 
带 来 过 重 的 负担 。 

数据 库 管理 系统 的 目标 就 是 为 大 规模 数据 提供 实时 便利 的 访问 方法 ， 同 时 确保 数据 库 的 完 
整 性 。 这 就 意味 着 数据 库 管 理 系统 必须 允许 用 户 对 关键 数据 元 素 定 义 和 管 理 规则 ,或 约束 。 有 
时 候 ， 这 些 约束 只 是 十 分 简单 的 规则 ， 如 “客户 编号 不 能 为 空 "。 更 复杂 的 规则 会 指定 哪些 特 
定 用 户 可 以 访问 哪些 数据 元 素 ， 以 及 文件 中 相互 联系 的 元 素 如 何 进行 更 新 。 安 全 约束 和 数据 完 
整 性 约束 的 定义 和 实施 对 于 任何 数据 库 管理 系统 的 可 用 性 都 是 至 关 重 要 的 。 
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数据 库 管理 系统 另 一 个 核心 组 件 就 是 事务 管理 咒 。 事 务 管理 器 以 确保 数据 库 一 致 的 方式 来 控 
制 数 据 对 象 的 更 新 。 从 形式 上 看 ， 事务 管理 器 控制 数据 状态 的 变化 ， 每 个 事务 具有 如 下 属性 : 
。 原子 性 一 一 事务 内 所 有 数据 的 更 改 操作 要 么 全 部 执行 ， 要么 全 部 不 执行 。 
。 一 致 性 一 一 事务 内 所 有 数据 元 素 的 更 新 必须 遵从 同样 的 约束 。 
人 
必须 尽快 写 人 “持久 ”存储 介质 中 (例如 ， 磁 盘 ) 。 








上 述 4 个 元 素 就 是 事务 管理 众所周知 的 ACID 属性 、 通 过 一 个 例子 可 以 很 容易 地 理解 ACID 
属性 的 重要 性 。 

假设 你 已 经 完成 了 每 月 的 信用 卡 还 款 ， 不 久 你 会 又 到 附近 的 商店 使 用 信用 卡 支付 男 外 一 笔 
费用 。 在 商店 售货员 划 卡 的 同时 ， 假 设 银行 职员 正在 将 你 之 前 的 那 笔 支付 输入 到 银行 的 数据 库 
中 。 图 8-18 展示 了 一 种 中 央 计 算 机 系统 处 理 上 述 事务 的 方式 。 


信用 卡 账户 


时 间 





图 8-18 一 个 事务 处 理 的 场景 


如 图 8-18 所 示 ， 银 行 职员 在 商店 售货员 划 卡 完成 之 前 实现 了 对 数据 库 的 更 新 ， 这 样 你 的 
账户 余额 将 为 300 美元 。 如 果 出 现 的 事务 场景 如 图 8-19 所 示 ， 则 商店 售货员 在 银行 职员 之 前 
完成 划 卡 ， 则 你 的 银行 账户 余额 为 0， 就 好 像 你 免费 买 到 了 东西 。 


信用 卡 账户 


时 间 





售货员 银行 职员 


图 8-19 男 一 个 事务 处 理 的 场景 


虽然 你 可 能 会 很 高 兴 获 得 了 免费 的 东西 ,但 你 同样 可 能 会 支付 两 次 账单 (或 与 银行 职员 发 
生 争 论 ， 直 到 你 的 银行 卡 记录 被 更 正 ) 。 这 种 情况 称 为 竞争 状态 因为 数据 库 的 最 终 状 态 不 取决 
于 更 新 的 正确 性 ， 而 是 取决 于 最 后 结束 的 是 哪个 事务 。 

事务 管理 器 通过 实施 原子 性 和 隔离 性 来 避免 竞争 状态 的 出 现 。 它 是 通过 将 各 种 锁 应 用 到 数 
据 记 录 上 来 实现 这 一 点 的 。 在 图 8-18 所 示 的 例子 中 ， 银 行 职员 在 操作 你 的 银行 卡 记 录 时 应 当 
被 授权 一 个 “专属 ” 锁 。 仅 当 更 新 后 的 余额 写 回 磁盘 后 才 会 释放 这 个 锁 。 当 银行 职员 的 事务 
还 在 运行 的 时 候 ， 售 货 员 将 会 获得 系统 繁忙 的 信息 。 当 完成 更 新 后 ， 事 务 管 理 器 释放 银行 职员 
的 锁 ， 并 立即 授权 另 一 个 锁 给 售货员 。 正 确 的 事务 处 理 如 图 8-20 所 示 。 





信用 卡 账户 





时 间 $200 





图 8-20 一 个 具有 隔离 性 和 原子 性 的 事务 处 理 


这 种 方法 存在 一 些 风险 。 在 复杂 系统 中 任何 时 候 一 个 加 锁 的 实体 都 可 能 会 引起 死 锁 。 系 统 
可 以 巧妙 地 管理 它们 的 锁 以 减少 死 锁 的 风险 ， 但 每 种 避免 或 删除 死 锁 的 方法 都 会 给 系统 带 来 更 
多 的 开销 。 如 果 有 太 多 的 锁 需 要 管理 ， 则 事务 处 理性 能 会 大 幅 下 降 。 一 般 说 来 ， 相 较 性 能 而 
言 ， 死 锁 的 避免 和 删除 都 是 次 要 的 。 死 锁 的 情况 很 少 发 生 ， 而 性 能 则 是 每 次 事务 处 理 必须 考虑 
的 因素 .。 

另 一 个 影响 性 能 的 因素 是 数据 日 志 。 在 更 新 记录 的 过 程 中 (包括 记录 删除 ) ， 数 据 库 事务 
管理 器 将 事务 的 镜像 写 到 一 个 日 志文 件 中 。 因 此 ， 每 次 更 新 都 至 少 需要 两 次 写 操作 ， 一 次 是 针 
对 主 文件 ， 另 一 次 是 针对 日 志文 件 。 日志 文件 十 分 重要 ， 如 果 事 务 由 于 发 生 错 误 而 必须 中 止 
时 ， 它 可 以 协助 系统 维护 事务 的 完整 性 。 例 如 ， 如 果 数 据 库 管理 系统 在 更 新 完成 前 获得 了 正在 
更 新 记录 的 镜像 ， 则 这 个 旧 镜 像 会 迅速 写 回 磁盘 ， 从 而 擦 除 所 有 后 续 对 该 记录 的 更 新 。 在 一 些 
系统 中 ,“ 之 前 ”和 “之 后 ”的 镜像 都 会 被 获取 ， 从 而 使 错误 恢复 相对 容易 。 

数据 库 日 志 还 可 用 于 审计 跟踪 ， 以 显示 哪些 人 在 什么 时 候 对 哪些 文件 进行 了 更 新 ， 以 及 哪 
些 数据 元 素 发 生 了 改变 。 小 心 的 系统 管理 员 会 将 这 些 日 志文 件 在 拱 形 磁 带 库 中 保存 很 多 年 。 

日 志文 件 是 进行 数据 备份 和 恢复 的 重要 工具 。 由 于 会 花费 大 量 的 时 间 ， 所 以 一 些 过 大 的 数 
据 库 文件 不 能 每 晚 都 备份 在 磁带 或 光盘 之 上 。 相 反 ， 每 周 只 备份 一 次 或 两 次 完整 的 数据 库 文 
件 ， 但 每 晚 都 必须 保存 日 志文 件 。 一 旦 这 些 备份 的 数据 库 文件 被 破坏 ， 则 在 其 他 时 间 保 存 的 日 
志文 件 将 用 于 回 滚 操作 ， 以 重建 每 天 的 数据 库 事 务 ， 就 如 同 重演 了 使 用 者 当初 更 新 数据 库 镜像 
时 的 操作 。 

刚刚 所 讨论 的 数据 库 访 问 控制 一 一 安全 管理 、 索 引 管 理 以 及 锁 管 理 ， 将 消耗 大 量 的 系统 资 
源 。 实 际 上 ， 对 于 早期 基于 文件 的 系统 来 说 这 种 开销 是 十 分 巨大 的 ， 因 为 其 主机 是 不 能 处 理 数 
据 库 管理 事务 的 。 即 使 是 当今 众多 强大 的 系统 ， 如 果 数 据 库 没 有 进行 正常 调整 和 维护 ， 也 会 造 
成 系统 否 吐 量 的 大 幅 下 降 。 大 规模 的 事务 环境 通常 由 系统 程序 员 和 保证 系统 运行 在 最 优 性 能 的 
数据 库 分 析 专 家 来 处 理 。 


8. 7 事务 管理 器 
一 种 提高 数据 库 性 能 的 方法 是 减少 数据 库 的 工作 量 ， 由 其 他 系统 组 件 完成 数据 库 的 部 分 工 


作 。 事 务 管理 器 作为 数据 库 的 一 个 组 件 经 常 从 数据 库 管 理 系统 核心 的 数据 管理 功能 中 分 离 出 
来 。 独 立 的 事务 管理 器 通常 还 包含 负载 平衡 和 其 他 优化 特征 ， 这 些 都 不 适合 在 核心 数据 库 软 件 
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中 实现 ， 因 此 独立 的 事务 管理 器 可 改善 整个 系统 的 有 效 性 。 但 商用 事务 需 使 用 两 个 或 更 多 个 独 
立 的 数据 库 时 ， 事 务 管理 器 是 特别 有 用 的 。 任 何 一 个 数据 库 都 不 会 负责 保证 数据 库 间 的 完整 
性 ， 这 是 由 一 个 外 部 事务 管理 器 来 实现 多 个 数据 库 间 同步 的 。 

早期 最 成 功 的 事务 管理 器 是 IBM 公司 的 客户 信息 和 控制 系统 (CICS) 。CICS 在 1968 年 投入 
市 场 ， 并 运行 了 40 余年 。CICS 是 十 分 值得 关注 的 ， 因 为 它 是 第 一 个 将 事务 处 理 (TP) ， 数 据 库 
管理 和 通信 管理 纳入 同一 个 应 用 程序 套件 的 系统 。CICS 中 的 组 件 是 松 耦 合 的， 每 个 组 件 都 可 
以 作为 一 个 独立 个 体 进 行 调整 和 管理 。CICS 中 的 通信 管理 组 件 控制 终端 机 与 主机 之 间 的 交互 ， 
这 称 为 会 话 。 由 于 数据 库 和 应 用 程序 从 协议 管理 的 负担 中 解放 出 来 了 ， 所 以 它们 可 以 更 有 效 地 
完成 自己 的 工作 。 

CICS 是 第 一 个 在 客户 端 - 服务 器 环境 中 采用 远程 过 程 调用 的 应 用 系统 。 相 比 于 其 他 的 同 
期 产品 ，CICS 能 够 管理 成 千 上 万 个 因特网 用 户 和 大 型 主 系统 之 间 的 事务 处 理 。 即 使 今天 ， 
CICS 仍 沿用 20 世纪 60 年 代 的 体系 结构 ， 这 一 结构 实际 上 已 经 成 为 事务 处 理 系 统 的 典范 。 现 代 
的 CICS 体系 结构 如 图 8-21 所 示 。 





图 8-21 CICS 体系 结构 


如 图 8-21 所 示 ， 一 个 名 为 事务 处 理 监 控 器 (TP 监控 器 ) 的 程序 是 系统 的 核心 组 件 。 它 从 远 
程 通信 管理 器 接受 输入 ， 并 对 数据 文件 进行 事务 授权 ， 这 些 文件 包含 用 户 授权 事务 的 列表 。 有 
时 候 ， 安 全 信息 中 包含 一 些 特殊 的 信息 ， 如 定义 了 哪些 位 置 可 以 运行 特定 的 事务 (例如 ， 内 联 
网 和 因特网 ) 。 一 旦 监控 器 对 事务 进行 了 授权 ， 那 么 它 就 发 起 用 户 请 求 的 应 用 程序 。 当 应 用 程 
序 需要 数据 时 ， 事 务 处 理 监控 器 就 向 数据 库 管理 软件 发 送 一 个 请 求 。 事 务 处 理 监控 器 在 完成 所 
有 工作 的 同时 ， 还 要 在 众多 并 发 应 用 进程 间 维 护 原 子 性 和 隔离 性 。 

你 也 许 正在 想 没 有 理由 将 所 有 这 些 事务 处 理 软件 组 件 放 到 同一 个 主机 中 。 的 确 ， 将 它们 放 
在 一 起 是 毫 无 道理 的 。 一 些 分 布 式 体 系 结构 将 一 些小 型 服务 器 分 组 以 运行 事务 处 理 监控 器 。 这 
些 系统 与 包含 数据 库 管理 软件 的 系统 完全 不 同 。 确 实 也 没有 必要 要 求 运行 事务 处 理 监控 器 的 系 
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统 与 运行 数据 库 软 件 的 系统 是 同类 型 系统 。 例 如 ， 使 用 Sun UNIX RISC 系统 进行 通信 管理 ， 并 
采用 Unisys ES/7000 在 Windows 数据 中 心 操作 系统 上 运行 数据 库 软 件 。 事 务 可 通过 台式 机 或 移 
动 个 人 计算 机 输入 系统 。 这 种 配置 就 是 众所周知 的 3 层 体系 结构 ， 每 个 平台 代表 一 层 ， 更 通用 
的 例子 就 是 n 层 或 多 层 体 系 结构 。 随 着 网 络 计算 和 电子 商务 的 出 现 ,n 层 事务 处 理 体 系 结构 越 
来 越 流行 。 许 多 厂商 ， 包 括 微 软 、Netscape 、Sybase 、SAP AG 以 及 IBM 的 CICS 都 成 功 设计 了 
各 种 n 层 事 务 系统 。 当 然 ， 我们 无 法 确定 上 述 哪 种 系统 对 于 某 个 特定 企业 “更 好 ”， 每 个 系统 
都 有 自己 的 优势 和 劣势 。 谨 慎 的 系统 架构 师 在 决定 哪 种 体系 结构 更 适合 某 个 特定 环境 之 前 ， 在 
设计 事务 处 理 系 统 时 会 考虑 所 有 的 成 本 和 可 靠 性 因素 。 


本 章 小 结 

本 章 描述 了 相互 依存 的 计算 机 硬件 和 软件 。 系 统 软 件 与 系统 硬件 协同 工作 以 创建 一 个 有 效 的 系统 。 
系统 软件 (包括 操作 系统 和 应 用 软件 ) ， 是 用 户 和 硬件 的 接口 ， 是 对 计算 机 底层 结构 的 抽象 。 这 使 得 用 户 
将 更 加 关注 问题 的 求解 ， 而 不 是 系统 操作 本 身 。 

硬件 和 软件 间 的 交互 和 深层 的 内 部 依赖 在 操作 系统 设计 中 最 为 明显 。 在 操作 系统 的 历史 发 展 中 ， 最 
开始 时 操作 系统 采用 “开放 商店 ”的 方法 ， 然 后 变 为 操作 符 驱 动 的 批 处 理 方法 ， 再 进化 到 支持 交互 式 多 
道 程序 和 分 布 式 计算 。 现 代 操作 系统 除了 提供 一 组 服务 ， 如 存储 器 管理 、 进 程 管理 、 通 用 资源 管理 、 调 
度 以 及 保护 ， 还 提供 了 用 户 接口 。 

操作 系统 的 概念 对 于 每 个 计算 机 专业 人 员 都 是 至 关 重要 的 。 实 际 上 ， 所 有 的 系统 操作 都 与 操作 系统 
提供 的 服务 紧密 相关 。 当 操作 系统 崩溃 时 ， 整 个 系统 就 会 骨 溃 。 因 此 ， 可 能 并 不 是 所 有 的 计算 机 都 需要 
操作 系统 。 这 对 于 嵌入 式 系统 尤为 明显 ， 在 第 10 章 会 看 到 相关 细节 。 在 汽车 或 微波 炉 中 计算 机 所 执行 的 
任务 十 分 简单 ， 可 能 不 需要 操作 系统 。 然 而 ， 对 于 不 只 是 执行 单程 序 这 类 最 简单 任务 的 计算 机 而 言 ， 考 
虑 到 系统 的 易 用 性 和 高 效 性 操作 系统 是 十 分 必要 的 。 操 作 系统 是 众多 大 型 软件 系统 中 的 一 个 例子 。 对 操 
作 系 统 的 研究 为 通用 软件 开发 提供 了 很 多 有 价值 的 参考 。 由 于 这 些 和 很 多 其 他 的 原因 ， 我 们 极力 鼓励 对 
操作 系统 设计 和 开发 进行 进一步 探索 。 

汇编 程序 和 编译 器 提供 了 转换 方法 ， 这 种 方法 将 可 读 计算 机 语言 转换 为 可 在 计算 机 上 执行 的 二 进 制 
指令 格式 。 解 释 器 也 会 产生 二 进 制 代码 ， 但 代码 产生 速度 和 效率 不 如 汇编 程序 。 

Java 编程 语言 产生 的 代码 由 位 于 字 节 码 和 操作 系统 之 间 虚 拟 机 进行 解释 。Java 代码 的 运行 速度 比 二 
进 制程 序 慢 ,， 但 它 可 移植 到 各 种 平台 之 上 。 

数据 库 系 统 软件 通常 通过 事务 处 理 系统 的 服务 来 控制 对 数据 文件 的 访问 。 数 据 库 系统 的 ACID 属性 
确保 了 数据 的 一 致 性 。 

构建 大 型 、 可 靠 系统 是 当今 计算 机 科学 面临 的 主要 挑战 。 到 现在 为 止 ， 你 应 当 明 白 一 个 计算 机 系统 
远 不 止 硬件 和 程序 。 企 业 级 系统 是 多 个 内 部 相互 关联 的 进程 的 集合 ， 每 个 进程 都 有 自己 的 功能 。 如 果 仅 
从 系统 用 户 的 角度 来 看 ， 这 些 进程 中 任意 一 个 性 能 低下 或 失效 的 进程 都 将 破坏 整个 系统 的 有 效 性 。 随 着 
工作 和 学 习 的 深入 ， 你 将 学 习 到 与 本 章 有 关 的 许多 主题 的 更 多 细节 。 如 果 你 是 一 个 系统 管理 员 或 系统 程 
序 员 ， 当 它们 应 用 在 一 个 特定 的 操作 环境 中 时 ， 你 会 精通 本 章 中 的 这 些 设计 思想 。 

无 论 如 何 优化 程序 ， 都 无 法 弥补 程序 所 依赖 的 系统 组 件 的 性 能 损失 。 请 钻研 第 11 章 ， 在 这 一 章 中 将 
叙述 更 多 关于 系统 性 能 的 细节 。 


扩展 阅读 

在 系统 软件 领域 最 有 意思 的 是 某 些 产品 的 文档 。 实 际 上 ， 你 可 以 通过 文档 的 质量 来 判断 一 个 产品 的 
质量 ， 并 关注 这 些 已 经 准备 好 文档 的 产品 。 访 问 制造 商 的 主页 ， 有 时 会 获得 关于 其 产品 最 好 的 介绍 。 在 
这 方面 做 得 最 好 的 两 个 制造 商 是 IBM 和 Sun， 其 主页 为 www. software. ibm. com 和 java. sun. com。 当 然 ， 如 
果 坚 持 的 话 ， 你 还 会 找到 很 多 其 他 的 主页 。 

Hall( 1994 ) 的 书 是 关于 客户 端 - 服务 器 系统 的 ， 书 中 对 客户 端 - 服务 器 的 理论 进行 了 出 色 的 介绍 。 
这 本 书 研究 了 一 些 当 时 十 分 流行 的 产品 。 
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Stallings(2012 ) 的 书 ，Tanenbaum 和 Woodhull(2006 ) 的 书 ，Silberschatz、Galvin 和 Gagne(2009 ) 的 书 所 
提出 的 很 多 有 关 操 作 系统 的 概念 在 本 章 中 都 有 介绍 ， 同 时 他 们 还 提出 了 很 多 更 高 级 的 主题 。Stallings 介绍 
了 各 种 操作 系统 的 详细 范例 以 及 它们 与 实际 硬件 之 间 的 关系 。 一 个 有 关 0S/360 开发 的 内 容 可 在 Brooks 
(1995 ) 的 书 中 找到 。 

Gorsline (1988 ) 写 的 汇编 书籍 对 于 汇编 器 是 如 何 工 作 给 出 了 较 好 的 叙述 。 他 也 深入 研究 了 链接 和 宏 
汇编 的 细节 。Aho、Sethi 和 Ullman (1986 ) 编著 了 “著名 的 "有 关 编 译 程序 的 书籍 。 因 为 封面 的 缘故 ， 通 常 
这 本 书 被 称 为 " 龙 书 ”， 它 已 经 连续 出 版 了 近 20 年 ， 主 要 因为 它 对 编译 理论 有 清晰 而 全 面 的 介绍 。 每 个 
计算 机 科学 家 都 应 当 有 这 本 书 。 

2005 年 5 月 出 版 的 AIEEE Computer》 专 门 介绍 了 虚拟 化 技术 。Smith 和 Nair 的 文章 特别 值得 推荐 。 
Rosenblum 和 Garfinkel 则 从 历史 的 角度 讨论 了 虚拟 机 在 监控 器 设计 时 所 面临 的 挑战 。 

很 少 有 服务 器 群 不 采用 某 种 形式 的 合并 和 虚拟 化 技术 。 虚 拟 化 服务 器 操作 系统 是 一 个 具有 广阔 前 景 
的 生态 市 场 。 为 了 学 习 更 多 关于 虚拟 化 的 知识 ， 你 可 以 访问 领先 的 VM 软件 供应 商 的 主页 ， 包 括 Citrix 
(Citrix. com) 、VMWare (vmware. com) 、Microsoft ( microsoft. com/ hyper-v-server) 以 及 IBM( ibm. com ). 

Sun Microsystem 是 任何 关心 Java 语言 的 人 都 需要 关注 的 资源 。Addison- Wesley 出 版 了 一 系列 关于 Java 
的 书籍 ,《Java 虚拟 机 说 明 书 》 是 其 中 之 一 ， 作 者 是 Lindholm 和 Yellin (1999)。 它 提供 了 一 些 关 于 类 文件 
构造 的 说 明 ， 这 通常 在 入 门 材料 中 不 会 介绍 。Lindholm 和 Yellin 的 书 还 包括 了 Java 字 节 码 指令 的 完整 列 
表 以 及 它们 的 二 进 制 格式 。 认 真 研 读 这 些 书籍 将 会 给 你 带 来 关于 编程 语言 的 全 新 认识 。 

虽然 稍微 过 时 些 , 但 Gray 和 Reuter (1993 ) 关 于 事务 处 理 的 书 是 十 分 全 面 而 且 易 读 的 。 它 为 你 在 该 领 
域内 的 进一步 学 习 提 供 了 良好 的 基础 。 一 本 评价 很 高 的 关于 数据 库 理论 和 应 用 的 书籍 是 由 Silberschatz， 
Korth 和 Sudarshan (2010) 扎 写 的 。 
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复习 题 
1. 相 比 现代 操作 系统 ， 早 期 操作 系统 的 主要 设计 目标 是 什么 ? 
2. 常 驻 监控 程序 为 计算 机 带 来 了 哪些 改善 ? 
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.对 于 打印 机 的 输出 ,“ 假 脱 机 ”这 个 词 是 如 何 产 生 的 ? 

. 请 描述 多 道 程序 系统 和 分 时 系统 的 不 同 。 

. 对 于 硬 实时 系统 而 言 ， 最 关键 的 设计 因素 是 什么 ? 

.多 处理 器 系统 可 以 按照 通信 方式 进行 分 类 。 在 本 章 ,， 按照 这 种 分 类 方法 ， 多 处 理 器 系统 可 以 分 为 

几 类 ? 

7. 分 布 式 操作 系统 和 网 络 操作 系统 有 什么 不 同 ? 

8. 什么 是 透明 性 ? 

9. 请 描述 两 种 完全 不 同 的 操作 系统 内 核 的 设计 观念 。 

10. GUI 操作 系统 接口 的 优点 和 缺点 各 是 什么 ? 

11. 长 期 调度 和 短期 调度 的 不 同 点 是 什么 ? 

12. 什么 是 抢占 式 调度 ? 

13. 在 分 时 操作 系统 中 ， 哪 种 进程 调度 方法 最 有 用 ? 

14. 哪 种 进程 调度 方法 可 能 是 最 优 的 ? 

15. 请 描述 上 下 文 切 换 所 涉及 的 步骤 。 

16. 除了 进程 管理 ， 操 作 系 统 的 另外 两 个 重要 功能 是 什么 ? 

17. 什么 是 覆盖 技术 ? 为 什么 在 大 型 计算 机 系统 中 不 再 使 用 覆盖 技术 了 ? 

18. 操作 系统 和 用 户 程 序 对 虚拟 机 的 认识 是 完全 不 同 的 。 请 描述 两 者 的 不 同 点 。 

19. 子 系统 和 逻辑 分 区 的 不 同 点 是 什么 ? 

20. 请 列举 服务 器 整合 的 优势 。 服 务 器 整合 对 于 每 个 企业 是 否 都 是 一 个 较 好 的 解决 方案 ? 

21. 请 描述 程序 设计 语言 的 层次 结构 。 为 什么 三 角形 符号 适 于 表述 这 种 层次 结构 ? 

22. 绝对 代码 和 可 重 定位 代码 有 什么 不 同 ? 

23. 链接 需 的 目的 什么 ? 它 与 动态 链接 库 有 什么 不 同 ? 

24. 请 描述 编译 器 每 个 阶段 的 作用 。 

25. 解释 器 与 编译 器 有 什么 不 同 ? 

26. Java 编程 语言 提供 的 可 移植 性 可 跨越 不 同 硬件 环境 ,那么 它 的 最 大 特点 是 什么 ? 

27. 汇编 程序 生成 的 机 器 代码 在 进行 链接 编辑 后 就 成 为 可 执行 文件 。Java 编译 器 所 产生 的 是 在 
执行 期 间 解 释 的 。 

28. 识别 Java 类 文件 的 魔 数 是 什么 ? 

29. 数据 库 逻 辑 视图 和 物理 视图 有 什么 不 同 ? 

30. 通常 用 哪 种 数据 结构 进行 数据 库 的 索引 ? 

31. 为 什么 数据 库 重 构 是 必要 的 ? 

32. 解释 数据 库 系统 的 ACID 属性 。 

33. 什么 是 竞争 状态 ? 

34. 数据 库 日 志 的 两 个 目的 是 什么 ? 

35. 事务 管理 器 提供 哪些 服务 ? 


习题 

1. 你 觉得 对 于 一 个 没有 操作 系统 的 计算 机 而 言 ， 它 的 局 限 性 是 什么 ”用 户 如 何 加 载 和 执行 一 个 程序 ? 

2. 微 内 核 是 一 个 尽 可 能 提供 最 基本 服务 的 小 内 核 ， 它 将 大 部 分 操作 系统 服务 放 到 了 其 他 模块 上 。 那 么 一 
个 内 核 所 能 提供 的 最 小 服务 集合 是 什么 ? 

3. 如 果 你 想 为 一 个 实时 操作 系统 编写 代码 ， 那 么 应 该 有 哪些 限制 ? 提示 : 考虑 引起 不 可 预知 响应 时 间 的 
事件 类 型 。( 例如 ， 什 么 情况 下 存储 器 访问 会 延迟 ?) 

4. 多 道 程序 和 多 进程 的 区 别 是 什么 ”多 道 程序 和 多 线程 的 区 别 又 是 什么 ? 

* 5. 在 什么 情况 下 ， 将 进程 和 程序 组 合 为 子 系统 在 大 型 计算 机 上 运行 是 可 取 的 ?在 这 个 系统 上 创建 逻辑 分 

区 的 优势 是 什么 ? 
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6. 在 同样 的 机 器 上 既 使 用 子 系统 又 使 用 逻辑 分 区 的 优势 是 什么 ? 

* 7. 什么 时 候 应 当 使 用 不 可 重 定位 二 进 制 代码 ? 为 什么 可 重 定位 二 进 制 代码 更 受 欢迎 ? 
8. 假设 没有 可 重 定位 程序 代码 ， 那 么 存储 器 的 分 页 机 制 将 变 得 如 何 复杂 ? 

* 9. 请 讨论 动态 链接 的 优势 和 劣势 。 


10. 


20. 
+* 21. 


22. 
23. 


24. 
*25. 


如 果 试 图 通过 遍历 一 次 源 文件 就 能 产生 完整 的 二 进 制 代码 ， 那 么 汇编 程序 必须 解决 什么 问题 ? 针对 
一 次 遍历 汇编 程序 编写 的 代码 和 针对 二 次 遍历 汇编 程序 编写 的 代码 有 什么 不 同 ? 


. 为 什么 在 进行 一 般 的 应 用 程序 开发 时 应 当 避 免 使 用 汇编 语言 ? 那么 在 什么 情况 下 需要 使 用 汇编 语言 ? 
. 在 什么 情况 下 你 会 倾向 于 使 用 汇编 语言 开发 应 用 程序 ? 

. 相 比 解释 型 语言 ， 使 用 编译 型 语言 的 优势 是 什么 ? 在 什么 情况 下 ， 你 会 选择 使 用 解释 型 语言 ? 

. 讨论 如 下 有 关 编 译 器 的 问题 : 


a) 编译 器 在 哪个 阶段 会 提示 语法 错误 ? 
b) 在 哪个 阶段 会 指出 未 定义 的 变量 ? 
c) 如 果 将 一 个 整数 与 一 个 字符 串 相 加 ， 编 译 器 会 在 哪个 阶段 提示 错误 信息 ? 


. 为 什么 Java 类 的 执行 环境 被 称 为 虚拟 机 ? 相 比 运行 C 程序 的 真实 机 器 ， 虚 拟 机 的 特点 是 什么 ? 

. 为 什么 假设 JVM 方法 区 对 于 在 虚拟 机 环境 中 运行 的 所 有 线程 都 是 全 局 的 ? 

.本章 提 到 在 JVM 上 运行 的 每 个 线程 中 一 次 仅 激活 一 个 方法 。 你 觉得 为 什么 会 这 样 ? 

. 访问 类 的 局 部 变量 数组 的 Java 字 节 码 最 多 占 两 个 字 节 。 一 个 字 节 为 操作 码 ， 男 一 个 字 节 表示 数组 中 


的 偏 移 。 局 部 变量 数组 可 保存 多 少 个 变量 ? 当 保存 的 变量 数目 超过 上 限时 ,会 发 生 什么 情况 ? 


.Java 称 为 解释 型 语言 ， 但 Java 也 是 产生 二 进 制 输出 流 的 编译 型 语言 。 请 解释 为 什么 Java 既是 编译 型 


语言 又 是 解释 型 语言 。 

请 解释 为 什么 在 JVM 中 运行 的 Java 程序 的 性 能 比 不 上 一 般 的 编译 型 语言 的 性 能 。 请 解释 原因 。 

回答 以 下 关于 数据 库 处 理 的 问题 : 

a) 什么 是 竞争 状态 ? 请 给 出 一 个 例子 。 

b) 如 何 避 免 竞争 状态 ? 

c) 为 了 避免 竞争 状态 ， 可 能 会 出 现 什么 风险 ? 

在 哪 几 个 方面 n 层 事务 处 理 体系 结构 要 优 于 单 层 体系 结构 ” 哪 种 体系 结构 的 成 本 更 高 ? 

为 了 提高 性 能 ， 公 司 决定 将 产品 数据 库 备份 到 多 个 服务 器 上 ， 这 样 就 不 会 造成 所 有 的 事务 都 去 竞争 

一 个 系统 。 对 于 这 种 情况 需要 考虑 哪些 问题 ? 

当 一 个 系统 资源 被 占用 时 ， 总 会 存在 死 锁 的 风险 。 请 描述 一 种 发 生死 锁 的 情况 。 

研究 不 同 的 命令 行 接口 (如 UNIX、MS- DOS 和 VMS) 和 不 同 的 窗口 接口 (如 Windows、MacOS 和 

KDE), 

a) 考虑 一 些 主要 的 命令 ， 如 获取 目录 列表 、 删 除 文件 或 改变 路 径 。 请 解释 每 一 种 命令 在 各 种 不 同 的 
操作 系统 上 是 如 何 实现 的 。 

b) 请 列举 和 解释 一 些 适合 命令 行 的 接口 ， 而 不 适合 GUI 的 接口 ? 请 列举 和 解释 一 些 适合 GUI 的 接 
口 ， 而 不 适合 命令 行 的 接口 。 

c) 你 更 喜欢 哪 种 类 型 的 接口 ， 为 什么 ? 
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在 之 前 的 章节 我 们 从 计算 机 科学 的 角度 介绍 了 相关 的 计算 技术 背景 知识 ， 这 些 介绍 是 基于 
单 处 理 器 系统 的 。 你 应 当 已 经 明白 了 各 种 硬件 组 件 的 功能 以 及 它们 对 于 系统 性 能 的 影响 。 理 解 
这 些 内 容 不 仅 对 于 硬件 设计 十 分 重要 ， 而 且 也 有 助 于 算法 的 高 效 实施 。 大 多 数 人 主要 通过 个 人 
计算 机 或 工作 站 来 获取 有 关 计 算 机 硬件 的 知识 。 这 样 将 无 法 接触 很 多 可 供 选择 的 计算 机 体系 结 
构 。 因 此 ， 本 章 我 们 将 介绍 一 些 性 能 优 于 冯 : 诺 依 曼 架 构 的 体系 结构 。 

本 章 将 讨论 RISC 设备 ， 基 于 指令 级 并 行 的 体系 结构 以 及 多 处 理 器 体系 结构 (对 并 行 处 理 进 
行 简明 介绍 ) 。 我 们 首先 介绍 RISC 和 CISC 两 种 指令 集体 系 结构 的 不 同 以 及 各 自 的 优势 和 劣势 。 
然后 ， 我 们 给 出 一 种 并 行 体 系 结构 分 类 的 方法 。 接 着 ， 我 们 讨论 指令 级 并 行 体 系 结构 的 内 容 ， 
重点 讲述 超标 量 体 系 结 构 和 EPIC( 显 式 并 行 指令 计算 机 )。 进 而 ,我 们 对 RISC 和 CISC 的 替代 
者 一 一 VLIW( 它 利用 了 指令 级 并 行 ) 进 行 回顾 ， 并 介绍 向 量 处 理 右 。 最 后 ,我 们 将 简单 介绍 一 
下 多 处 理 器 系统 以 及 一 些 可 供 选择 的 并 行 化 方法 ， 包 括 脉动 阵列 、 数 据 流 计算 、 神 经 网 络 以 及 
量子 计算 。 

计算 机 硬件 设计 者 在 20 世纪 80 年 代 早期 开始 重新 评估 各 种 体系 结构 的 设计 准则 。 他 们 的 
首要 目标 是 指令 集体 系 结构 。 设 计 者 试图 弄 清 在 大 多 数 时 间 内 只 有 20% 的 指令 会 使 用 时 ， 为 
什么 还 要 使 用 复杂 的 扩展 指令 集 。 这 一 问题 促进 了 RISC 机 器 的 发 展 ， 我 们 之 前 曾 在 第 4 和 第 5 
章 中 对 其 进行 过 介绍 ， 在 本 章 我 们 会 用 专门 的 一 节 详 细 讲 解 。RISC 设计 的 广泛 使 用 引起 了 
CISC 和 RISC 技术 的 融合 。 目 前 ,很 多 体系 结构 都 采用 RISC 内 核 来 实现 CISC 架构 。 

第 4 和 第 5 章 提 到 过 的 一 些 新 型 体系 结构 ， 如 VLIW 、EPCI 和 多 处 理 器 占据 了 硬件 市 场 份 
额 的 很 大 一 部 分 。 利 用 体系 结构 开发 的 指令 级 并 行 的 出 现 推进 了 分 支 预 测 技 术 的 发 展 。 基 于 这 
些 预测 的 预 取 指 令 显著 增加 了 计算 机 的 性 能 。 此 外 ,为 了 预测 下 一 条 需要 读 取 的 指令 ， 高 度 的 
指令 级 并 行刺 激 了 一 些 新 技术 的 产生 ， 比 如 推测 执行 ， 该 项 技术 可 以 使 处 理 器 在 实际 执行 之 前 
猜测 运算 结果 。 

在 本 章 中 我 们 还 将 涉及 多 处 理 器 系统 。 对 于 这 些 体 系 结构 ， 我 们 可 以 使 用 牛 来 进行 类 比 。 
如 果 我 们 利用 一 头 牛 拔 一 棵 树 ， 但 树 太 大 了 ， 并 且 我 们 也 无 法 养 一 只 更 大 的 牛 ， 则 我 们 会 使 用 
两 头 牛 来 完成 这 个 工作 。 多 处 理 器 体系 结构 与 多 头 牛 同时 工作 是 类 似 的 ， 如 果 我 们 需要 解决 拔 
树桩 的 问题 ， 那 么 就 需要 多 头 牛 (多 个 处 理 器 ) 。 然 而 ， 多 处 理 器 系统 也 会 引发 一 些 特 有 的 问 
题 ， 特 别 是 会 造成 高 速 缓存 一 致 性 和 存储 一 致 性 的 问题 。 

我 们 注意 到 一 些 体系 结构 性 能 的 提升 取决 于 其 成 本 的 增加 。 当 前 ， 系 统 性 能 与 成 本 往往 
呈 非 线性 关系 。 在 大 多 数 情况 下 ， 成 本 的 大 幅 增加 仅仅 换 来 较 小 的 性 能 提升 。 这 将 造成 很 
难 在 主流 应 用 中 使 用 这 些 体系 结构 。 但 是 ， 这 些 体系 结构 仍然 在 市 场 中 占有 一 席 之 地 。 比 如 ， 
高 精度 科学 和 工程 应 用 对 机 器 性 能 提出 了 极 高 的 要 求 ， 在 这 个 时 候 成 本 通常 不 再 是 考虑 的 
因素 。 

当 你 阅读 本 章 时 ， 请 牢记 第 1 章 介 绍 过 的 有 关 计 算 机 发 展 的 内 容 。 基 于 本 章 所 介绍 的 体系 
结构 ,很 多 人 相信 我 们 已 经 进入 了 下 一 个 计算 机 时 代 ， 特 别 是 进入 了 并 行 处 理 的 时 代 。 
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9.2 ”RISC 设备 


在 第 4 章 中 , 我 们 曾经 列举 过 RISC 体系 结构 的 例子 。RISC 准确 地 说 并 不 是 一 种 体系 结 
构 ， 而 是 一 种 设计 方法 。RISC ( 精简 指令 集 计 算 机 ) 这 个 名 称 来 源 于 其 可 提供 比 CISC 指令 集 规 
模 更 小 的 指令 集 。 随 着 RISC 设备 的 发 展 , “精简 ”一 词 正在 逐渐 偏离 其 本 意 。“ 精简 ”一 词 最 
初 的 意思 是 提供 一 个 可 支持 所 有 基本 操作 的 最 小 指令 集 ， 如 数据 移动 、ALU 操作 以 及 分 支 。 仅 
load 和 store 两 种 指令 可 以 访问 存储 器 。 

复杂 指令 集 的 设计 目的 主要 是 为 了 解决 当时 存储 器 成 本 过 高 的 问题 。 在 一 条 指令 中 打包 更 
多 的 操作 将 有 效 减少 程序 量 ， 因 此 ， 消 耗 更 小 的 存储 资源 。 当 存储 器 容量 较 小 时 ， 减 少 程序 规 
模 是 十 分 重要 的 ， 所 以 CISC 很 自然 成 为 那个 时 代 计 算 机 技术 的 产物 。CISC 指令 集体 系 结构 采 
用 变 长 指令 ， 简 单 指令 具有 和 较 短 的 指令 字 ， 复杂 指令 具有 和 较 长 的 指令 字 。 此 外 ，CISC 体系 结 
构 包 括 了 大 量 的 直接 访问 内 存 的 指令 。 因 此 ， 功 能 强大 的 密集 的 变 长 指令 集 将 导致 执行 每 条 指 
令 需要 花费 多 个 时 钟 周 期 才能 完成 。 一 些 复杂 的 指令 ， 特 别 是 访 存 指令 ， 需 要 花费 上 百 个 时 钟 
周期 。 在 一 些 特 定 环境 中 ， 计 算 机 设计 者 发 现 必 须 降 低 系 统 的 时 钟 频 率 ( 增 加 两 个 时 钟 沿 之 间 
的 时 间 间 隔 ) 以 保证 有 足够 的 时 间 完 成 指令 。 这 最 终 导 致 程序 执行 时 间 的 延长 。 

人 类 语言 可 以 呈现 出 一 些 RISC 和 CISC 的 特性 ， 因 此 使 用 它 可 以 作为 类 比 来 理解 两 者 之 间 
的 不 同 。 假设 你 有 一 个 中 国 笔友 ,并 且 你 们 都 可 以 流畅 地 读 / 写 英文 和 中 文 。 虽然 你 们 希望 写 
长 篇 幅 的 信 ， 但 更 倾向 于 以 一 种 最 经 济 的 方式 进行 沟通 。 你 们 可 以 选择 使 用 贵 的 航空 信纸 (这 
将 节省 可 观 的 邮费 ) ， 或 者 使 用 普通 信纸 (这 将 使 用 更 多 的 邮票 ) 。 第 三 种 选择 就 是 在 每 张 信 纸 
中 书写 更 多 的 信息 。 

相 比 中 文 ， 英 文 更 简单 但 是 比较 宛 长 。 中 文字 符 相 比 英 文字 母 更 复杂 ， 可 能 需要 200 个 英 
文字 母 才 能 表达 20 个 中 文字 符 的 含义 。 因 此 ， 使 用 中 文 需要 较 少 的 字符 ， 这 将 节省 纸张 和 邮 
资 。 然 而 ， 读 / 写 中 文 很 困难 ， 因 为 每 个 字符 包含 了 更 多 的 信息 。 英 文字 符 类 似 于 RISC 指令 ， 
中 文字 符 则 类 似 于 CISC 指令 。 对 于 大 多 数 以 英文 为 母语 的 人 ,“ 处 理 ” 英 文 信件 需要 花费 更 少 
的 时 间 ， 但 是 需要 更 多 的 信纸 。 

虽然 ， 很 多 人 都 鼓吹 RISC 是 一 种 全 新 的 、 革 命 性 的 设计 ， 但 实际 上 RISC 的 设计 思想 早 在 
20 世纪 370 年 代 中 期 就 由 IBM 公司 的 John Cocke 提出 过 。Cocke 在 1975 年 设计 了 一 个 RISC 原型 
机 Model 801。 这 个 系统 在 刚 开始 没有 受到 任何 关注 ， 有 关 它 的 细节 直到 数 年 后 才 公 布 。 在 
1980 年 ，David Patterson 和 David Ditzel 发 表 了 著名 的 文章 《 Case for a Reduced Instruction Set 
Computer》。 这 篇 文章 以 一 种 全 新 的 方式 思考 了 计算 机 体系 结构 ， 并 首次 提出 了 CISC 和 RISC 
这 两 种 缩写 。 由 Patterson 和 Ditzel 所 提出 的 新 型 体系 结构 倾向 简单 指令 ， 所 有 指令 具有 同样 的 
长 度 。 每 个 指令 所 能 完成 的 工作 有 限 ,但 指令 所 花费 的 执行 时 间 是 相同 的 ， 而 且 是 可 预知 的 。 

对 RISC 的 支持 来 自 对 CISC 上 运行 程序 的 观察 。 这 些 研 究 揭 示 数 据 移 动 指令 几乎 占 到 全 部 
指令 的 45% ，ALU 操作 (包括 算术 、 比 较 和 逻辑 ) 占 到 25% ， 分 支 (或 流程 控制 ) 占 到 30% 。 虽 
然 存 在 很 多 复杂 指令 ， 但 它们 很 少 用 到 。 这 一 发 现 再 结合 更 加 便宜 、 容 量 更 大 的 存储 器 的 出 现 
以 及 VLSI 技术 的 发 展 ， 导 致 了 很 多 不 同类 型 体系 结构 的 出 现 。 存 储 絮 更 加 便宜 意味 着 程序 可 
以 使 用 更 多 的 存储 资源 。 由 简单 、 可 预知 指令 构成 的 更 大 型 程序 可 以 替代 由 复杂 的 、 变 长 指令 
构成 的 短程 序 。 简 单 指令 可 以 使 用 更 短 的 时 钟 周期 。 此 外 ， 指 令 种 类 越 少 意味 着 芯片 使 用 的 唱 
体 管 越 少 。 唱 体 管 越 少 意味 着 更 低 的 芯片 制造 成 本 ， 并 且 芯 片上 可 以 有 更 多 的 面积 用 于 其 他 用 
途 。 指 令 可 预测 性 再 加 上 VLSI 的 发 展 ， 使 得 很 多 性 能 得 到 了 提升 ， 如 流水 线 可 以 使 用 硬件 实 
现 。CISC 很 难 提供 这 些 性 能 提升 的 机 会 。 

使 用 如 下 基本 的 计算 机 性 能 计算 公式 ,我 们 可 以 通过 量化 方式 分 析 RISC 和 CISC 的 不 同 : 





时 间 时间 、 多 个 周期 、 多 个 指令 
程序 ” 间 个 周期 ”单个 指令 ” 程序 
计算 机 性 能 通常 用 程序 运行 时 间 来 表示 。 程 序 的 运行 时 间 与 时 钟 周期 ， 每 条 指令 的 时 钟 周期 数 
以 及 程序 中 的 指令 数 成 正比 。 缩 短 时 钟 周期 可 以 使 RISC 和 CISC 的 性 能 都 得 到 提升 。 另 外 ， 通 
过 减少 程序 中 的 指令 数 可 以 提升 CISC 的 性 能 ， 而 通过 最 小 化 每 条 指令 的 时 钟 周期 数 可 以 提升 
RSIC 的 性 能 。 因 此 ， 两 种 体系 结构 可 以 在 几乎 相同 的 时 间 内 计算 出 结果 。 在 门 级 ， 两 种 系统 
完成 同样 的 工作 量 。 那 么 到 底 在 门 级 和 程序 级 之 间 发 生 了 什么 ? 

CISC 设备 依靠 微 代码 来 执行 指令 。 微 代码 告知 处 理 器 如 何 执行 一 条 指令 。 出 于 性 能 的 原 
因 ， 微 代码 一 般 是 紧凑 而 高 效 的 ， 并 且 通 常 是 正确 的 。 然 而 ， 微 代码 的 效率 受 限于 变 长 指令 ， 
因为 变 长 指令 降低 了 译 码 速度 ， 并 且 导 致 每 条 指令 所 花费 的 时 钟 周期 数 也 不 同 ， 从 而 使 得 很 难 
实现 指令 流水 线 。 此 外 ， 当 每 条 指令 从 存储 器 取出 后 微 代码 进行 翻译 。 这 个 额外 的 翻译 过 程 也 
消耗 了 一 定 的 时 间 。 指 令 集 越 复杂 ， 花 费 在 翻译 指令 上 的 时 间 就 越 多 ， 并 且 要 设置 合适 的 硬件 
资源 来 处 理 指令 。 

RISC 体系 结构 采用 了 不 同 的 方法 。 大 多 数 的 RISC 指令 可 以 在 一 个 时 钟 周期 内 完成 。 为 了 
实现 加 速 ， 微 程序 控制 器 由 硬 连 线 逻 辑 所 取代 ， 硬 连 线 将 以 更 快 的 速度 执行 指令 。 这 样 ， 可 以 
较 容易 地 实现 指令 流水 线 ， 但 在 硬件 层面 上 很 难 对 复杂 指令 进行 处 理 。 因 此 ， 在 RISC 系统 中 ， 
对 复杂 指令 的 处 理由 指令 集 层面 转移 到 编译 器 之 上 。 

为 了 说 明 这 一 点 ， 让 我 们 来 看 一 条 指令 。 假 设 我 们 想 计算 5 x10， 则 在 CISC 设备 上 代码 可 
能 如 下 所 示 : 


mov ax, 10 
mov bx, 5 
mul bx, ax 


一 个 最 精简 的 RISC 指令 集体 系 结构 没有 乘法 指令 。 因 此 ， 在 RISC 设备 上 ， 乘 法 代码 将 如 下 
所 示 : 





mov ax, 0 
mov bx, 10 
mov cx, 5 
Begin: add ax, bx 
loop Begin ;Causes a loop cx times 


虽然 CISC 代码 更 短 ， 但 需要 更 多 的 时 钟 周期 来 执行 程序 。 假 设 对 于 每 种 体系 结构 ， 寄 存 
吉 -寄存 器 传输 指令 、 加 法 指令 和 循环 操作 均 花 费 1 个 时 钟 周期 ， 而 乘法 指令 则 需要 花费 30 
个 时 钟 周期 "。 对 比 两 个 代码 片段 ， 则 有 : 


CISC 指令 : 
总 的 时 钟 周期 = (2 movs x 1 个 时 钟 周期 ) + (1 mul x 30 个 时 钟 周期 ) 
= 32 个 时 钟 周 其 
RISC 指令 : 


总 的 时 钟 周 期 = (3 movs x 1 个 时 钟 周期 ) + (5 adqds x 1 个 时 钟 周 期 ) 
+ (5 loops x1 个 时 钟 周期 ) = 13 个 时 钟 周 期 
另外 需要 补充 的 是 RISC 设备 的 时 钟 周期 通常 比 CISC 设备 短 ， 因 此 即使 RISC 设备 有 更 多 的 指 
令 ， 其 执行 时 间 仍 然 小 于 CISC 设备 。 这 就 是 提出 RISC 设备 的 主要 灵感 。 
我 们 曾经 提 到 过 降低 指令 复杂 度 也 将 减少 芯片 设计 的 复杂 程度 。 用 于 执行 CISC 指令 的 蝇 
体 管 主要 用 在 了 构建 流水 线 、 缓 存 和 寄存 器 上 。 在 这 三 者 中 ， 寄 存 器 堆 最 有 可 能 改善 系统 性 





加 ”这 不 是 一 个 真实 的 数字 ， 在 Intel 8088 上 ， 执 行 两 个 16 位 数 相 乘 运算 需要 133 个 时 钟 周期 。 
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能 ， 因 此 有 必要 增加 寄存 器 的 数目 ， 并 应 以 新 颖 的 方式 使 用 这 些 寄存 器 。 一 种 方法 就 是 使 用 寡 
存 器 窗口 集 。 虽 然 不 像 其 他 和 RISC 体系 结构 相关 的 创新 型 方法 被 广泛 采用 ， 但 寄存 器 窗口 仍 
然 是 一 个 很 有 意思 的 想法 ， 在 这 我 们 将 对 其 进行 简单 介绍 。 

高 级 语言 依靠 模块 化 来 提升 效率 ， 这 会 带 来 过 程 调 用 和 参数 传递 两 个 副作用 。 过 程 调用 是 
一 个 至 关 重 要 的 任务 。 它 包括 了 保存 返回 地 址 ,保存 寄存 器 值 ， 传 递 参数 (将 参数 压 和 人 栈 中 或 
使 用 寄存 器 ) ， 跳 转 到 子 例 程 ， 以 及 执行 子 例 程 。 一 旦 子 例 程 执行 完 ， 必 须 保存 刚 改 变 的 参数 
值 ， 并 且 在 返回 运行 调用 进程 前 必须 恢复 现场 。 保 存 现场 、 传 递 参数 以 及 恢复 现场 都 将 消耗 大 
量 资源 。 随 着 RISC 芯片 可 以 容纳 成 百 上 千 个 寄存 器 ， 保 护 和 恢复 序列 的 工作 将 会 减少 以 简化 
对 寄存 器 环境 的 改变 。 

为 了 充分 理解 这 一 概念 ， 试 着 想象 将 所 有 寄存 器 划分 为 若干 组 。 当 一 个 程序 在 某 一 环境 中 
执行 时 ， 仅 一 组 寄存 器 是 可 见 的 。 如 果 发 生 了 程序 调用 ， 则 可 见 的 寄存 器 组 也 将 发 生 改 变 。 例 
如 ， 当 主 程序 运行 时 ， 也 许 它 能 使 用 0 ~ 9 号 寄存 器 。 当 一 个 过 程 被 调用 时 ， 该 过 程 则 可 能 
用 10 ~19 号 寄存 器 。 通 常情 况 下 ，RICS 体系 结构 包含 16 个 寄存 器 组 (窗口 ) ， 每 组 有 32 个 寄 
存 器 。CPU 在 一 个 周期 内 只 能 使 用 其 中 一 个 窗口 。 因 此 ， 从 程序 员 的 角度 看 ， 仅 有 32 个 寄存 
器 可 用 。 

寄存 器 窗口 并 不 一 定 有 助 于 过 程 调 用 或 参数 传递 。 然 而 ， 如 果 这 些 寄存 器 窗口 能 够 精确 地 
重合 ， 则 从 一 个 模块 向 男 一 个 模块 传递 参数 的 过 程 就 变 为 了 从 一 个 寄存 右 组 转移 到 男 一 个 寄存 
器 组 这 样 简单 的 事情 了 ， 在 这 个 过 程 中 ， 两 个 寄存 器 组 中 重 和 到 寄存 器 是 因为 共享 寄存 器 可 以 传 
递 参数 。 上 述 过 程 通常 将 寄存 器 组 划分 为 若干 个 不 重 友 的 寄存 器 集合 ， 包 括 全 局 寄存 器 (所 有 
共有 寄存 器 窗口 ) 、 局 部 寄存 器 ( 每 个 寄存 器 窗口 独 有 ) 、 输 入 寄存 器 (与 之 前 窗口 的 输出 寄存 
器 重 肥 ) 以 及 输出 寄存 器 (与 下 一 个 窗口 的 输入 寄存 融 重 和合 ) 。 当 CPU 从 一 个 过 程 切 换 到 男 一 个 
过 程 时 ， 寄 存 器 窗口 也 要 发 生 切换 ， 但 重 和 至 部 分 通过 将 调用 过 程 的 输出 寄存 天 变换 为 调用 过 程 
的 输入 寄存 器 来 简化 “传递 ”参数 的 过 程 。 一 个 当前 窗口 指针 (CWP) 指 向 当前 正在 使 用 的 寄 
存 器 窗口 。 

考虑 如 下 场景 ， 过 程 1 调用 过 程 2。 每 个 寄存 器 窗口 有 32 个 寄存 器 ， 假 设 8 个 是 全 局 寄存 
器 、8 个 是 局 部 寄存 器 、8 个 为 输入 寄存 器 、8 个 为 输出 寄存 器 。 当 过 程 1 调用 过 程 2 时 ， 任 何 
需要 传递 的 参数 都 放 人 过 程 1 寄存 器 窗口 的 输出 寄存 器 中 。 一 旦 过 程 2 开始 执行 ,这些 寄存 带 


变 为 过 程 2 的 输入 寄存 器 。 这 一 过 程 如 图 9-1 所 示 。 
RO 
R7 


<— CWP=8 


进程 1 





二 > R8 CWP =24 
重 芋 ” | 输入 寄存 器 
Re » RS 
R16 
… | 局 部 寄存 器 进程 2 
R23 
R24 
… | 输出 寄存 器 
R31 


图 9-1 重合 寄存 器 窗口 
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需要 特别 注意 的 一 点 是 ，RISC 上 的 寄存 器 窗口 具有 寄存 器 集 的 循环 特性 。 对 于 一 个 多 层 
舱 套 调用 的 程序 来 说 ， 寄 存 器 资源 可 能 很 快 会 耗 尽 。 这 个 时 候 ， 主 存 用 来 存储 最 低 编 号 寄存 器 
窗口 中 的 值 ， 这 些 值 都 属于 最 外 层 过 程 ， 然 后 最 高 编号 的 寄存 器 窗口 ( 当前 进程 ) 将 使 用 已 保 
存 的 最 低 编号 寄存 器 。 当 从 执行 过 程 中 返回 时 ， 符 套 层 数 减 少 ， 保 存在 存储 器 中 的 寄存 器 值 按 
照 保存 的 顺序 依次 恢复 。 

除了 结构 简单 ， 定 长 指令 和 流水 线 技术 也 显著 提高 了 RISC 设备 的 处 理 速 度 。 简 单 指令 节省 
了 大 量 的 芯片 面积 ， 这 不 仅 可 以 提供 更 多 有 用 的 芯片 空间 ， 而 且 使 得 芯片 更 将 易于 设计 和 制造 。 

你 应 当 已 经 意识 到 我 们 很 难 将 当今 的 处 理 器 归 类 为 RISC 结构 还 是 CISC 结构 ， 因 为 在 大 多 
数 的 CPU 体系 结构 中 均 采 用 了 这 两 种 结构 。 这 两 种 结构 的 分 界线 已 经 模糊 。 目 前 的 一 些 体系 
结构 会 同时 使 用 RISC 和 CISC 技术 。 如 果 你 阅读 一 些 最 新 的 芯片 手册 ,那么 可 知 当今 的 RISC 
设备 拥有 一 些 比 CISC 设备 更 复杂 的 指令 。 例 如 ，RISC POWERPC 所 拥有 的 指令 集 比 CISC 
Pentium 的 规模 更 大 。 大 多 数 当 今 的 RISC 处 理 器 已 经 增加 了 乘法 和 除法 指令 ， 并 利用 微 代 码 去 
执行 这 些 指令 。 男 一 方面 ， 最 新 的 CISC 处 理 器 在 某 种 程度 上 是 基于 RISC 技术 的 ; Intel 的 x86 
架构 就 是 一 个 这 样 的 例子 。x86 的 CISC 指令 在 执行 前 会 通过 微 代码 转化 为 一 组 简单 的 RISC 指 
令 格 式 。 当 VLSI 技术 将 晶体 管 变 得 更 小 、 更 廉价 后 ， 指 令 集 的 扩张 将 不 再 是 CISC 和 RISC 争 
论 的 问题 ， 而 寄存 器 的 使 用 以 及 装载 /存储 体系 结构 将 变 为 争论 的 重点 。 

这 样 ， 我们 在 表 9-1 中 总 结 了 RISC 和 CISC 的 主要 不 同 。 


表 9-1 RISC 和 CISC 的 特征 


















































' RISC CISC 

多 个 寄存 器 组 ， 通 常 包 含 256 个 以 上 的 寄存 器 一 个 寄存 器 组 ， 一 般 共 包含 6 ~ 16 个 寄存 器 

每 条 指令 可 包含 3 个 寄存 器 操作 数 (例如 ，ada Rl ， 每 条 指令 可 包含 1 个 或 2 个 寄存 器 操作 数 (例如 ，ada 
R2 ,R3 ) R1,R2) 

通过 高 效 的 片上 寄存 器 窗口 进行 参数 传递 通过 低 效 的 片 外 存储 器 进行 参数 传递 

单 周期 指令 (除了 load 和 store 指令 ) 多 周期 指令 

硬 连 线 控制 微 程序 控制 

流水 线程 度 高 流水 线程 度 低 

简单 指令 并 且 指 令 数 较 少 许多 复杂 指令 

固定 长 度 指令 el 变 长 指令 

编译 器 设计 复杂 微 代码 设计 复杂 

仅 1oad 和 store 指令 可 以 访 存 许多 指令 都 可 以 访 存 

较 少 的 寻 址 方式 许多 寻 址 方式 





我 们 曾经 提 到 过 目前 RISC 与 其 字面 含义 已 经 有 了 很 大 的 不 同 。 虽 然 RISC 最 初 的 目标 是 精 
简 指 令 集 ， 但 RISC 的 设计 原则 已 经 发 生 了 很 大 的 变化 。Paul DeMone 曾经 说 过 ,目前 RISC 的 
主要 关注 点 可 以 总 结 为 :“ 如 果 某 条 指令 或 某 个 寻 址 方式 需要 通过 一 系列 其 他 指令 来 实现 ， 则 
这 条 指令 或 寻 址 方式 不 应 当 包含 在 指令 集体 系 结构 中 ， 除 非 在 考虑 新 指令 带 来 的 负面 影响 ， 诸 
如 给 数据 通路 和 控制 逻辑 增加 的 硬件 复杂 度 ， 降 低 时 钟 频率 以 及 与 现 有 指令 的 冲突 后 ， 发 现 引 
入 这 条 指令 或 寻 址 方式 仍 会 给 处 理 器 带 来 显著 的 性 能 提升 ” 。 第 二 个 设计 原则 要 求 RISC 处 理 器 
不 应 在 运行 时 通过 硬件 执行 任何 可 以 在 编译 时 通过 软件 完成 的 任务 。 

我 们 已 经 提 到 过 虽然 CISC 和 RISC 这 两 种 体系 结构 在 早期 存在 显著 差别 ,但 两 者 相互 借鉴 
并 发 生 了 很 大 的 改变 ， 以 至 于 现在 很 难 将 某 种 计算 机 体系 结构 准确 地 归 为 两 类 之 一 。 实 际 上 ， 
RISC 和 CISC 这 两 个 词 已 经 从 根本 上 失去 了 本 来 的 含义 。 但 随 着 嵌入 式 设 备 ， 特 别 是 移动 计算 
出 现 后 ， 这 两 个 词 的 含义 又 出 现 了 差异 。 除 了 相对 便宜 的 制造 成 本 ,手机 和 平板 电脑 需要 处 理 
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需 能 够 有 效 地 利用 存储 器 、CPU 周期 和 功 耗 ， 由 此 可 见 RISC 设计 原则 更 适合 于 移动 计算 环境 。 

当 RISC 和 CISC 之 争 首次 出 现时 ， 其 关注 点 在 于 芯片 面积 和 处 理 需 设计 的 复杂 程度 ， 但 现 
在 能 耗 和 功 耗 成 为 了 焦点 。 这 里 需要 提 及 两 个 正在 试图 控制 市 场 的 竞争 对 手 : ARM 和 Intel。 
Intel 通常 关注 性 能 ， 它 占据 了 服务 器 市 场 的 大 量 份额 但 ARM 更 加 关注 能 效 ， 因 此 其 统治 了 
移动 设备 和 艇 人 式 系统 市 场 。( 实 际 上 ，ARM 最 新 的 64 位 处 理 器 又 重新 引入 了 RISC 和 CISC 
之 争 。) Intel 正在 试图 通过 Atom 处 理 器 来 争夺 移动 终端 市 场 。 然 而 ，Atom 的 发 展 受 困 于 它 的 
CISC 结构 (特别 是 腾 肿 的 指令 集 ) ， 这 也 是 为 什么 移动 终端 市 场 更 倾向 选择 ARM 和 MIPS 这 样 
的 体系 结构 。 即 使 Intel 正在 采用 一 些 其 他 的 技术 来 提升 处 理 执行 速度 ， 过 于 爱 肿 的 译 码 逻 辑 
以 及 含有 很 多 无 用 指令 的 指令 集 仍然 是 难以 解决 的 问题 。 

像 我 们 之 前 提 到 的 ， 虽然 很 多 人 都 极其 推崇 RISC 设计 的 革命 性 创新 ， 但 在 RISC 设备 中 所 
使 用 的 很 多 技术 (包括 流水 线 和 简单 指令 ) 早 在 20 世纪 60 年 代 和 70 年 代 的 原型 机 中 就 出 现 了 。 
很 多 被 称 为 创新 的 新 设计 ， 其 实 并 不 是 真正 的 创新 ， 只 是 简单 的 发 展 循环 。 革 新 并 不 一 定 意味 
着 发 明 一 个 全 新 的 车 轮 ， 也 可 能 是 找到 一 种 如 何 使 用 已 有 车 轮 的 最 好 方法 。 这 是 在 你 计算 机 职 
业 生 涯 中 的 重要 一 课 。 


9. 3 ”Flynn 分 类 法 

多 年 以 来 ,一 些 研 究 人 员 试 图 找到 一 种 更 科学 的 计算 机 体系 结构 的 分 类 方法 。 虽 然 没 有 一 
种 分 类 法 是 完美 无 缺 的 ， 但 今天 被 广泛 接受 的 是 Michael Flynn 在 1972 年 提出 的 分 类 法 。Flynn 
分 类 法 考虑 两 方面 因素 : 进入 处 理 器 的 指令 数 和 数据 流 数 。 一 台 计 算 机 可 以 有 1 个 或 多 个 数据 
流 ， 并 且 可 以 有 1 个 或 多 个 对 数据 进行 操作 的 处 理 器 。 这 样 ， 我 们 就 可 以 得 到 4 种 可 能 的 组 
合 : SISD( 单 指令 流 单数 据 流 ) 、SIMD ( 单 指令 流 多 数据 流 ) 、MISD ( 多 指令 流 单数 据 流 ) 和 
MIMD ( 多 指令 流 多 数据 流 ) 。 

单 核 处 理 器 属于 SISD 设备 。SIMD 设备 器 具有 单个 控制 器 ， 可 以 在 多 个 数据 上 同时 执行 相 
同 的 指令 。SIMD 架构 包含 阵列 处 理 器 、 向 量 处 理 器 和 脉动 阵列 。MISD 设备 器 在 相同 的 数据 上 
执行 不 同 的 指令 。MIMD 设备 器 具有 多 个 控制 器 ， 每 个 具有 单独 的 数据 流 指令 流 。 多 处 理 器 和 
当前 大 多 数 并 行 系统 都 属于 MIMD 设备 。SIMD 计算 机 的 设计 相 比 MIMD 更 加 简单 ， 但 它们 缺 
乏 灵 活性 。 所 有 的 SIMD 多 处 理 器 必须 同时 执行 相同 的 指令 。 因 此 ， 当 执行 条 件 分 支 指令 时 ， 
处 理 需 的 性 能 将 受到 很 大 的 影响 。 

Flynn 分 类 法 在 一 些 方面 还 存在 不 足 。 首 先 ， 很 少 有 符合 MISD 架构 特性 的 应 用 。 其 次 ， 
Flynn 假设 所 有 的 并 行 性 都 是 同 构 的 ， eet 一 台 计 算 机 
可 能 有 4 个 独立 的 浮 点 加 法 器 、2 个 乘法 器 和 1 个 整数 运算 单元 。 这 人 台 机 器 可 以 并 行 执行 7 个 
操作 ， 但 很 难 采 用 Flynn 分 类 法 对 它 进行 分 类 。 

Flynn 分 类 法 的 另 一 个 问题 就 是 MIMD 分 类 。 在 没有 考虑 多 个 处 理 器 间 是 如 何 互 连 的 或 这 
些 处 理 器 是 如 何 看 待 主 存 的 情况 下 ,一 个 具有 多 处 理 器 的 体系 结构 会 被 归 为 此 类 。 因 此 ， 出 现 
了 几 种 对 MIMD 重新 定义 的 分 类 方法 。 根 据 是 否 共 享 存储 器 ， 以 及 是 基于 总 线 连接 还 是 交换 开 
关连 接 的 ， 可 将 MIMD 进一步 划分 为 不 同 的 系统 。 

在 共享 存储 器 系统 中 ， 所 有 的 处 理 器 访问 同一 个 全 局 存储 器 ， 并 通过 共享 变量 进行 通信 ， 
就 好 像 在 一 个 单 处 理 器 上 进行 数据 处 理 。 如 果 多 个 处 理 器 没有 共享 存储 器 ， 则 每 个 处 理 器 都 必 
须 拥 有 一 个 私有 存储 器 。 这 样 ， 所 有 的 处 理 器 必须 通过 消息 传递 这 种 昂贵 而 低 效 的 方式 进行 通 
petit he 共享 存储 器 和 消息 传递 实际 上 属于 不 同 的 编程 模 

， 而 不 是 硬件 模型 。 因 此 ， 它 们 其 实 应 该 交 属 于 系统 软件 的 范 蝴 。 

两 种 主要 的 并 行 体系 结构 范例 是 对 称 多 处 理 器 (SMP) 和 大 规模 并 行 处 理 器 (MPP) ， 它 们 都 
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属于 MIMD 体系 结构 ,但 两 者 的 区 别 在 于 如 何 使 用 主 存 。SMP 设备 [ 如 基于 Intel 双核 处 理 咒 的 
PC 机 和 Silicon Graphics Origin 3900( 最 多 可 拥有 512 个 处 理 器 ) ] 共享 存储 器 ,但 MPP 设备 [ 如 
nCube 、CM5 和 Gray T3E] ， 则 不 共享 存储 器 。 这 些 MPP 系统 通常 在 一 个 大 型 机 柜 中 装配 了 上 
千 个 CPU， 以 连接 几 百 GB 的 存储 器 。 因 此 ， 这 些 系 统 的 价格 将 高 达到 几 百 万 美元 。 

最 开始 的 时 候 ，MPP 这 个 词 主 要 是 指 紧 耦 合 的 SIMD 系统 ， 如 Connection Machine 和 Good- 
year MPP。 然 而 ， 时 至 今日 ，MPP 通常 用 来 指 拥有 多 个 独立 节点 ， 且 每 个 节点 都 有 私有 存储 顺 
的 并 行 体系 结构 ， 这 些 节点 可 通过 一 个 网 络 进行 通信 。 一 种 区 分 SMP 和 MPP 的 简单 方法 如 下 
所 示 : 

MPP = 众 核 + 分 布 式 存储 + 基于 网 络 的 通信 
SPP = 多 核 + 共享 存储 器 + 基于 存储 器 的 通信 

MPP 计算 机 编程 较 困难 ， 因 为 程序 设计 者 必须 确保 在 每 个 CPU 上 运行 的 程序 片段 都 能 够 彼此 
通信 。 而 在 所 有 处 理 器 同时 访问 相同 的 存储 空间 时 ，SMP 系统 会 出 现 严重 的 性 能 瓶颈 。 采 用 
MPP 还 是 SMP 的 决定 因素 是 应 用 程序 一 一 如 果 待 求解 的 问题 很 容易 划分 ， 则 MPP 是 一 个 较 好 
的 选择 。 很 多 大 公司 都 采用 MPP 系统 存储 客户 数据 (数据 中 心 )， 并 在 这 些 数据 上 进行 数据 
挖掘 

分 布 式 计算 是 另 一 种 MIMD 体系 结构 。 分 布 式 计算 (细节 请 见 9.4.5 节 的 介绍 ) 一 般 是 指 一 
组 通过 网 络 进行 互 连 的 计算 机 ， 它 们 相互 协同 以 求解 问题 。 但 协同 的 方式 可 能 有 很 多 种 。 

工作 站 网 络 ( NOW ) 是 一 组 并 行 工 作 的 分 布 式 工作 站 的 集合 ， 网 络 中 的 每 个 节点 不 再 作为 
普通 工作 站 来 使 用 。NOW 通常 由 异 构架 构 组 成 ， 使 用 不 同 的 处 理 器 和 软件 ， 节 点 间 通 过 因 特 
网 进行 通信 。 个 人 用 户 在 加 入 到 并 行 计 算 环 境 之 前 必须 首先 与 网 络 建立 连接 。NOW 通过 局 域 
网 部 署 在 各 个 企业 中 , 在 这 些 网 络 中 所 有 的 工作 站 都 可 控 。 工 作 站 集群 (COW ) 与 NOW 很 相 
似 ， 但 是 它 需 要 一 个 公司 或 组 织 负责 管理 。 节 点 通常 运行 相同 的 软件 ， 并 且 每 个 用 户 可 以 访问 
任何 节点 。 专 用 集群 并 行 计 算 机 ( DCPC ) 是 一 组 专门 用 于 某 个 特定 并 行 计 算 任务 的 工作 站 集 
合 。 所 有 工作 站 由 一 个 独立 的 组 织 机 构 来 管理 ， 运 行 相同 的 软件 和 文件 系统 ， 并 通过 因特网 进 
行 通信 。PoPC 是 由 专用 异 构 硬 件 构成 的 集群 ， 这 些 硬件 构建 的 并 行 计算 系统 不 是 由 大 众 商 用 
组 件 或 COT 组 成 的 。DCPC 使 用 少量 昂贵 、 快 速 的 组 件 ， 而 PoPC 则 使 用 大 量 慢 速 ， 但 相对 低 
廉 的 节点 。NOW、COW、DCPC 以 及 PoPC 均 属于 集群 计算 ， 其 分 布 式 计算 资源 将 处 于 同一 个 
管理 域 ,但 在 不 同 的 组 中 工作 。 

1994 年 由 Goddard 航空 中 心 的 Thomas Sterling 和 Donald Becker 提出 的 BEOWULF 工程 是 一 
个 PoPC 体系 结构 ， 它 成 功 地 通过 一 个 专用 软件 将 各 种 硬件 平台 组 织 在 一 起 ,使 其 看 起 来 就 像 
一 台 并 行 计算 机 。BEOWULF 集群 具有 3 个 特征 : 现成 的 个 人 计算 机 、 快 速 数 据 交换 和 开源 软 
件 。BEOWULF 中 的 节点 通过 以 太 网 或 光纤 网 络 进行 连接 。 如 果 你 拥有 一 台 旧 的 Sun SPARC ， 
两 台 486 计算 机 ， 一 台 DEC Alpha( 或 者 干 台 积 满 灰尘 的 Intel 计算 机 ) ， 并 且 可 以 将 它们 接 入 网 
络 ， 那 么 你 就 可 以 安装 BEOWULF 软件 ， 以 构建 属于 你 个 人 的 强大 的 并 行 计算 机 。 

Flynn 分 类 法 最 近 又 新 加 入 了 SPMD( 单 程序 多 数据 ) 体系 结构 。 一 个 SPMD 包含 多 个 处 理 
器 ， 每 个 处 理 器 有 属于 自己 的 数据 集 和 程序 存储 器 。 在 每 个 处 理 器 上 都 运行 相同 的 程序 ， 并 可 
在 各 个 全 局 控制 点 进行 同步 。 虽 然 每 个 处 理 器 都 加 载 相同 的 程序 ， 但 它们 运行 的 指令 可 能 不 
同 。 例 如 ， 一 个 程序 如 下 所 示 : 

If myNodeNum = 1 do this, else do that 
在 SPMD 中 ， 不同 的 计算 节点 执行 相同 程序 中 的 不 同 指令 。SPMD 实际 上 是 采用 了 MIMD 编程 
框架 ,这 与 SIMD 不 同 ， 其 区 别 是 多 个 处 理 器 能 在 同一 时 刻 完成 不 同 的 工作 。 超 级 计算 机 通常 
采用 SPMD 设计 。 


可 供 选 树 的 体系 结构 367 





在 Flynn 分 类 法 之 上 ， 我 们 需要 增加 新 的 类 别 ， 它 们 可 能 是 指令 驱动 的 体系 结构 也 可 能 是 
数据 驱动 的 体系 结构 。 典 型 的 冯 ' 诺 依 曼 体 系 结构 是 指令 驱动 的 。 所 有 处 理 器 执行 的 操作 由 一 
串 代 码 决 定 。 指 令 在 数据 上 进行 操作 。 数 据 驱 动 体 系 结构 ， 或 称 为 数据 流体 系 结构 ， 则 正好 相 
反 ， 数据 的 特征 决定 了 处 理 器 的 事件 序列 。 我 们 将 在 9. 5 节 继 续 讨论 更 多 有 关 数 据 流 体系 结构 
的 细节 。 

通过 增加 数据 流 计算 机 和 对 MIMD 分 类 进行 细 化 后 ， 体 系 结构 的 分 类 如 图 9-2 所 示 。 你 可 
以 参照 该 图 阅读 后 续 部 分 。 我 们 从 分 类 树 的 左 侧 分 支 开 始 ， 先 来 讨论 SIMD 和 MIMD 体系 结构 。 


ew | 
wx | | 


共享 存储 器 分 布 式 存储 ak | 
天 规模 并 
| 分 布 式 系统 


图 9-2 计算 机 体系 结构 的 一 种 分 类 法 


9.4 ”并行 和 多 处 理 器 体系 结构 

长 期 以 来 ， 科 学 家 一 直 致 力 于 设计 能 更 快 、 更 好 求解 问题 的 机 器 。 小 型 化 技术 改善 了 电子 
线路 ， 使 得 芯片 内 部 可 以 集成 更 多 的 晶体 管 。 变 得 更 快 的 时 钟 ， 使 得 CPU 的 主 频 达到 了 千 兆 
赫 效 。 我 们 知道 一 些 物理 上 的 局 限 性 限制 了 单 核 处 理 器 的 性 能 。 发 热 和 电磁 干扰 限制 了 晶体 管 
的 集成 密度 。 即 使 解决 了 这 些 问 题 ， 处 理 器 的 速度 仍然 会 低 于 光速 。 在 这 些 物理 局 限 性 之 上 ， 
还 存在 成 本 上 的 制约 。 在 某 些 情况 下 ， 设 计 一 个 处 理 器 的 成 本 将 超过 人 们 愿意 购买 的 价格 。 最 
终 ， 除 了 将 计算 任务 分 配 到 几 个 处 理 器 上 ,我 们 再 没有 其 他 可 行 的 办 法 去 改善 处 理 器 的 性 能 
了 。 基 于 这 些 原因 ， 并 行 处 理 便 越 来 越 引 起 人 们 的 关注 。 

然而 ， 值 得 注意 的 是 并 不 是 所 有 的 应 用 都 能 通过 并 行 获得 性 能 提升 。 例 如 ， 多 处 理 器 并 行 
带 来 了 额外 的 计算 开销 ( 如 进程 间 的 同步 及 其 他 有 关 进 程 管理 方面 的 技术 )。 如 果 无 法 对 一 个 
应 用 进行 并 行 化 ， 则 该 应 用 不 能 高 效 地 移植 到 一 个 多 处 理 器 并 行 的 体系 结构 上 。 

通过 正确 地 实现 ， 并 行 性 会 导致 更 高 的 吞吐 量 、 更 好 的 容错 ， 以 及 更 优 的 性 价 比 。 虽 然 ， 
并 行 性 可 以 显著 提升 加 速 比 ， 但 并 不 能 获得 最 高 加 速 比 。 假 设 有 个 处 理 器 并 行 运行 ， 则 最 高 
加 速 比 表示 一 个 计算 任务 仅 需 花费 1/n 时 间 就 可 完成 ， 同 时 获得 了 信 的 性 能 提升 (或 者 运行 
时 间 缩 短 了 1/n)。 

我 们 仅 需 回忆 一 下 阿 姆 达 尔 定律 就 可 以 知道 为 什么 无 法 达到 最 高 加 速 比 。 如果 两 个 处 理 模 
块 以 两 种 不 同 的 速度 运行 ， 则 较 慢 的 模块 将 决定 最 终 的 运行 速度 。 这 个 定律 也 可 以 计算 出 通过 
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并 行 处 理 器 求解 问题 时 所 能 获得 的 加 速 比 。 无 论 你 多 努力 地 对 应 用 进行 并 行 化 ， 应 用 中 总 是 会 
有 一 小 部 分 工作 必须 由 一 个 处 理 器 串 行 处 理 。 这 时 ， 多 余 的 处 理 器 无 任何 工作 可 做 ， 必 须 等 待 
直到 串 行 处 理 任 务 完成 。 阿 姆 达尔 定律 的 基本 前 提 就 是 每 一 个 算法 的 串 行 部 分 将 最 终 决定 多 处 
理 器 实现 的 加 速 比 。 串 行 部 分 所 占 比例 越 多 ， 则 采用 并 行 处 理 器 架构 的 效率 就 会 越 低 。 

多 处 理 器 仅 是 不 同 的 并 行 体系 结构 中 的 一 种 。 在 之 前 的 章节 中 ,我 们 提 到 过 其 他 一 些 面 向 
多 数据 处 理 的 并 行 体系 结构 ， 如 流水 线 、VLIW 以 及 指令 级 并 行 (ILP)， 它 们 针对 不 同 的 类 型 。 
这 样 的 例子 还 包括 SIMD 结构 ， 如 向 量 处 理 器 、 神 经 网 路 处 理 器 和 脉动 处 理 器 。 有 许多 体系 结 
构 允 许 有 多 个 ( 并行) 处 理 器 和 MIMD 设备 的 所 有 特征 。 需 要 注意 的 是 ,“ 并 行 ”一 词 有 很 多 的 
含义 和 层次 ,我 们 必须 能 够 区 分 它们 之 间 的 不 同 。 

接 下 来 ,我 们 首先 讨论 指令 级 并 行 体系 结构 ， 然 后 讨论 SIMD 和 MIMD 体系 结构 。 在 本 章 
最 后 一 节 我 们 将 介绍 一 些 非 主 流 的 并 行 处 理 方法 ,包括 脉动 阵列 、 神 经 网 络 和 数据 流 计算 。 


9. 4. 1 超标 量 和 超 长 指令 字 

在 本 小 节 中 ， 我 们 将 重 温 超标 量 体 系 结构 和 超 长 指令 字体 系 结构 。 超 标量 和 VLIW 都 是 展 
现 指令 级 并 行 的 方法 , 但 两 者 之 间 有 很 大 的 不 同 。 为 了 给 后 续 讨 论 打 下 基础 ， 我 们 先 来 看 一 下 
超 流 水 线 的 概念 。 流 水 线 技术 将 取 指 - 译 码 - 执行 周期 划分 为 若干 阶段 ， 其 中 一 组 指令 在 同一 
时 刻 将 处 于 不 同 的 阶段 。 理 想 情 况 下 ， 在 每 个 时 钟 周期 内 都 将 执行 完 一 条 指令 。 然 而 ， 因 为 代 
码 中 存在 分 支 指令 和 数据 依赖 性 ， 所 以 无 法 实现 每 个 时 钟 周期 完成 一 条 指令 的 目标 。 

当 流水 线 中 某 些 阶段 的 执行 时 间 小 于 时 钟 周期 的 一 半 时 ， 可 引入 超 流水 线 技 术 。 一 个 频率 
为 外 部 时 钟 频 率 两 倍 的 内 部 时 钟 加 入 到 处 理 器 中 ,这样 可 以 在 一 个 外 部 时 钟 周 期 内 完成 两 个 任 
务 。 虽 然 超 流水 线 既 可 以 应 用 于 RISC 体系 结构 也 可 应 用 于 CISC 体系 结构 ， 但 它 主要 还 是 应 用 
于 RISC 处 理 器 中 。 超 流水 线 是 超标 量 设计 中 的 一 个 方面 ， 也 正 是 因为 如 此 ， 通 常会 混淆 两 者 
的 概念 。 

所 以 ， 准 确 地 说 究竟 什么 才 是 超标 量 处 理 器 呢 ? 我 们 知道 Pentium 处 理 器 是 超标 量 处 理 器 ， 
但 我 们 还 没有 讨论 过 超标 量 的 真正 含义 。 超 标量 是 一 种 在 每 个 时 钟 周期 内 可 以 使 得 多 条 指令 同 
时 执行 的 设计 方法 。 虽 然 超标 量 在 一 些 方面 不 同 于 流水 线 ， 但 它们 的 性 能 提升 效果 是 相同 的 。 
在 超标 量 设计 中 实现 加 速 的 方法 与 为 繁忙 的 高 速 公 路 增加 一 条 车 道 的 思路 是 类 似 的 。 在 超标 量 
中 ， 需 要 增加 额外 的 “硬件 ”， 最 终 使 得 在 同样 的 时 间 内 从 4 点 到 B 点 可 以 有 更 多 的 车 辆 ( 指 
令 ) 通 过 。 

类 似 于 增加 的 高 速 公路 车 道 ， 在 超标 量 中 对 应 的 组 件 称 为 执行 单元 。 执 行 单元 由 浮 点 加 法 
器 、 乘 法 器 、 整 数 加 法 器 和 乘法 器 ， 以 及 其 他 专用 模块 组 成 。 虽 然 这 些 单元 可 以 独立 工作 ， 但 
很 重要 的 一 点 是 ， 在 超标 量 体 系 结构 中 有 足够 多 的 专用 单元 可 以 并 行 处 理 多 条 指令 。 一 般 执 行 
单元 会 被 复制 多 份 ， 例 如 ， 一 个 系统 可 能 有 一 对 相同 的 浮 点 运算 单元 。 通 常 ， 执 行 单元 也 采用 
流水 线 架构 ， 并 提供 更 高 的 性 能 。 

在 超标 量 中 至 关 重 要 的 组 件 是 一 个 专用 的 取 指 单元 ， 它 可 以 同时 从 存储 器 中 获取 多 条 指 
令 。 然 后 ， 取 指 单元 将 指令 依次 送 入 一 个 复杂 的 译 码 单元 ， 以 判断 指令 之 间 是 否 相 互 独立 (也 
就 是 说 是 否 可 以 并 行 执行 ) 或 者 是 否 存在 某 种 依赖 关系 (对 于 这 种 情况 这 些 指令 将 无 法 在 同一 
时 刻 并 行 执行 ) 。 

例如 ， 我 们 来 看 一 下 IBM RS/6000 处 理 器 。 这 个 处 理 器 含有 一 个 取 指 单元 和 两 个 处 理 器 ， 
每 个 处 理 器 又 包含 一 个 6 级 浮 点 单元 和 一 个 4 级 整数 单元 。 取 指 单元 由 两 级 流水 线 构成 ， 其 中 
第 一 级 每 次 从 存储 器 中 获取 4 条 指令 ， 第 二 级 将 指令 发 送 到 合适 的 处 理 单元 。 

超标 量 计 算 机 是 通过 流水 线 和 复制 实现 并 行 的 体系 结构 。 超 标量 设计 包括 超 流水 线 ， 同 时 
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获取 多 条 指令 、 复 杂 的 译 码 逻 辑 以 确定 指令 的 独立 性 并 对 独立 的 指令 进行 组 合 ， 以 及 足够 的 计 
算 资 源 以 保证 多 条 指令 并 行 执行 。 我 们 注意 到 ， 虽 然 这 种 类 型 的 并 行 需要 专用 的 硬件 ， 同 时 超 
标量 体系 结构 也 需要 一 个 复杂 的 编译 器 对 操作 进行 调度 ， 以 确保 更 好 地 利用 计算 资源 。 

相 比 超标 量 处 理 器 既 要 依赖 硬件 (判断 独立 性 ) ， 也 要 依赖 编译 器 (产生 合适 的 调度 ) 而 
言 ，VLIW 处 理 器 将 完全 依赖 编译 器 。VLIW 将 独立 指令 打包 成 一 个 长 指令 ， 以 此 来 依次 触 
发 执行 单元 进行 相应 的 操作 。 因 为 编译 器 更 能 方便 地 获取 代码 中 指令 的 全 局 独立 性 信息 ， 
因此 VLIW 具备 更 高 的 性 能 。 然 而 ,编译 器 无 法 获得 运行 时 代码 的 全 局 信息 ， 因 此 指令 调度 
将 受到 局 限 。 

因为 VLIW 编译 器 会 生成 超 长 指令 ， 所 以 也 需要 对 独立 性 进行 判断 。 这 些 在 编译 时 固定 长 
度 的 长 指令 一 般 会 包含 4 ~8 条 常规 指令 。 因 为 指令 是 定 长 的 ， 所 以 任何 调整 (比如 改变 存储 器 
延迟 ) 都 有 可 能 影响 指令 调度 的 结果 ， 从 而 需要 重新 编译 代码 ， 洪 在 地 引发 软件 生产 商 的 诸多 
问题 。VLIW 的 拥护 者 指出 这 项 技术 通过 将 复杂 度 转移 给 编译 器 简化 硬件 的 设计 难度 。 超 标量 
的 拥护 者 则 指出 ，VLIW 会 造成 代码 量 的 增加 。 例 如 ， 当 超常 指令 字 不 需要 程序 控制 域 的 时 候 ， 
存储 空间 和 带宽 都 会 被 浪费 。 实 际 上 ， 当 一 个 普通 的 Fortran 程序 被 编译 为 VLIW 代码 后 ， 其 代 
码 量 将 变 为 原来 的 2 倍 ， 甚 至 3 倍 。 

Intel 的 Itanium 1A-64 采用 VLIW 体系 结构 ， 它 是 一 种 EPIC 风格 的 YLIW 处 理 器 。EPIC 体 
系 结构 相 比 传统 的 VLIW 处 理 器 具有 一 些 优 势 。 与 VLIW 类 似 ，EPIC 也 将 打包 指令 以 发 送 到 各 
种 执行 单元 。 然 而 ， 与 VLIW 不 同 的 是 ， 这 些 打包 指令 不 需要 有 相同 的 长 度 。 一 个 专用 的 分 隔 
符 用 于 指明 一 个 打包 指令 的 结束 和 另 一 个 打包 指令 的 开始 。 指 令 字 通过 硬件 进行 预 取 ， 然 后 进 
行 指令 识别 ， 并 将 打包 指令 调度 到 独立 的 组 中 进行 并 行 执行 。 这 将 在 一 定 程度 上 克服 由 于 编译 
器 无 法 获取 运行 时 代码 的 全 局 信息 而 带 来 的 局 限 性 。 打 包 中 的 指令 可 并 行 执行 并 且 无 依赖 性 ， 
因此 无 须 关 心 其 执行 顺序 。 大 多 数 人 仍然 认为 EPIC 就 是 VLIW。 虽 然 Intel 不 认同 这 一 点 ， 并 
且 硬 件 架 构 师 也 列举 了 二 者 之 间 一 些微 小 的 差别 ， 但 EPIC 本 质 上 就 是 加 强 版 的 VLIW 。 


9.4.2 向 量 处 理 器 

通常 被 称 为 超级 计算 机 的 向 量 处 理 器 是 专门 定制 的 ， 它 具有 的 强大 流水 的 SIMD 处 理 器 可 
高 效 实现 完整 的 向 量 和 和 矩阵 操作 。 这 类 处 理 器 适合 于 具有 高 度 并 行 性 的 应 用 ， 如 天 气 预报 、 医 
学 诊断 和 图 像 处 理 。 

为 了 弄 懂 向 量 处 理 技 术 ， 首 先 必须 了 解 向 量 算术 。 向 量 是 定 长 的 一 维 矩 阵 ， 或 是 一 个 有 序 
的 标量 序列 。 在 向 量 上 可 定义 的 运算 包括 加 法 、 减 法 和 乘法 。 

向 量 计算 机 是 高 度 流水 的 ， 因 此 各 种 算术 运算 可 重 和 执行。 每 条 指令 都 指定 了 一 组 可 在 向 
量 上 执行 的 操作 。 例 如 ， 我 们 执行 向 量 V1 和 v2 的 加 法 ， 并 将 结果 放 到 v3 中 。 传 统 处 理 器 将 
通过 如 下 循环 实现 这 个 操作 : 


for i = 0 to VectorLength 


W3 Ss VID] Itjy 
但 在 向 量 处 理 器 上 ， 这 段 代码 将 变 为 
LDV Vi, R1 ;将 向 量 V1 加 载 到 向 量 寄存 器 R1 上 


LDV V2, R2 

ADDV R3, R1, R2 

STV R3, V3 ;将 向 量 寄存 器 R3 的 内 容 保存 到 向 量 V3 
向 量 寄存 器 是 一 次 可 以 保存 几 个 向 量 的 专用 寄存 器 。 每 次 可 将 寄存 器 中 一 个 元 素 发 送 到 回 量 流 
水 线 ， 而 每 次 流水 线 输出 一 个 元 素 送 回 向 量 寄存 器 。 因 此 ， 这 些 寄存 器 是 一 些 可 以 保存 很 多 元 
素 的 FIFO 队列 。 向 量 处 理 器 通常 会 有 几 个 这 种 向 量 寄存 器 。 向 量 处 理 器 的 指令 集 包 含 加 载 这 





些 寄存 带 的 指令 ， 对 寄存 硕 中 的 元 素 进行 操作 的 指令 ， 以 及 将 向 量 数据 存 回 至 存储 器 的 指令 。 

根据 指令 如 何 获取 操作 数 ， 向 量 处 理 器 通常 被 分 为 两 类 。 在 寄存 器 -寄存 器 向 量 处 理 器 中 
源 操作 数 和 目的 操作 数 都 保存 在 寄存 器 中 。 存 储 器 - 存储 器 向 量 处 理 器 允许 将 操作 数 从 存储 器 
中 取出 并 直接 送 到 算术 单元 。 运 算 的 结果 写 回 存储 器 。 寄 存 器 - 寄存 器 处 理 吉 存在 的 问题 是 长 
向 量 必须 分 割 成 固定 长 度 的 短 向 量 以 确保 可 以 存放 在 寄存 器 中 。 然 而 ， 存 储 器 - 存储 器 处 理 需 
由 于 访 存 延 迟 会 造成 启动 时 间 较 长 。( 启 动 时 间 是 指 从 初始 化 指令 到 从 流水 线 中 获得 第 一 个 运 
算 结果 的 时 间 间 隅 。) 在 流水 线 满 流 后 ， 将 不 再 有 访 存 延 迟 问题 。 

向 量 指令 展现 的 高 效 性 主要 归功 于 两 方面 原因 。 首 先 ， 处 理 器 取 指 的 数量 明显 变 少 ， 这 意 
味 着 译 码 、 控 制 单元 会 有 更 少 的 开销 ， 并 且 需 要 更 少 的 存储 带宽 。 其 次 ， 处 理 器 拥有 连续 输入 
的 数据 源 ， 因 此 可 以 提前 预 取 相 关 数据 。 如 果 使 用 交叉 存储 器 ， 则 每 个 时 钟 周期 都 可 以 获得 一 
对 数据 。 最 流行 的 向 量 处 理 器 是 Cray 系列 超级 计算 机 向 量 处 理 器 的 基本 架构 在 过 去 的 25 年 间 
变化 很 少 。 


9.4.3 互连网 络 

在 共享 存储 多 处 理 器 和 分 布 式 计算 等 MIMD 系统 中 ， 通 信 对 于 处 理 同 步 和 数据 共享 至 关 重 
要 。 消 息 在 系统 中 的 传递 方式 决定 了 整个 系统 的 设计 。 通 常 存在 两 种 通信 模型 ， 它 们 是 共享 存 
储 和 互连网 络 。 共 享 存储 系统 包含 一 个 大 容量 存储 器 ， 所 有 的 处 理 器 都 可 以 对 其 进行 访问 。 在 
互连网 络 中 ， 每 个 处 理 器 都 有 一 个 私有 存储 器 ， 但 处 理 器 可 以 通过 网 络 访问 其 他 处 理 器 的 存储 
器 。 当 然 ， 两 者 都 各 有 优 缺 点 ， 

互连网 络 通常 可 以 根据 拓扑 结构 、 路 由 策略 以 及 交换 技术 进行 分 类 。 网 络 拓扑 结构 ( 即 网 
络 中 节点 的 互 连 方式 ) ， 是 消息 传递 开销 中 的 主要 决定 因素 。 信 息 传递 的 效率 受 以 下 几 方 面 
限制 : 

带宽 一 一 网 络 传递 消息 的 能 力 。 

消息 延迟 一 一 消息 中 的 第 一 位 到 达 目 的 端 所 用 的 时 间 。 

传输 延迟 一 一 消息 在 网 络 中 的 传输 时 间 。 

开销 一 一 消息 在 发 送 方 和 接收 方 的 处 理 活动 。 
因此 ， 网 络 设 计 试 图 最 小 化 所 需 的 消息 数量 和 消息 传递 的 距离 。 

互连网 络 可 以 是 静态 的 ， 也 可 以 是 动态 的 。 在 动态 网 络 中 两 个 实体 (可 以 是 两 个 处 理 器 ， 
也 可 以 是 一 个 处 理 器 和 一 个 存储 器 ) 之 间 的 连接 路 径 可 以 发 生 改变 , 但 在 静态 网 络 中 不 可 以 。 
互连网 络 可 以 是 阻塞 的 ， 也 可 以 是 非 阻塞 的 。 当 同时 出 现 其 他 连接 时 ， 非 阻塞 网 络 允 许 使 用 这 
些 连 接 ， 而 阻塞 网 络 则 不 允许 。 

静态 互连网 络 主要 用 于 多 种 类 型 的 消息 传递 ， 其 中 许多 类 型 可 能 是 你 所 熟悉 的 。 处 理 器 通 
常 使 用 静态 网 络 互 连 ， 而 处 理 器 和 存储 器 之 间 通 常 采用 动态 网 络 互 连 。 

全 连接 网 络 是 指 网 络 中 的 每 个 组 件 都 与 其 他 组 件 相连 。 构 建 这 种 网 络 十 分 昂贵 ， 并 且 当 有 
新 的 组 件 加 入 时 ， 很 难 对 其 进行 管理 。 在 星 形 连接 网 络 中 有 一 个 中 心 交 换 机 ， 所 有 的 消息 都 必 
须 通 过 该 交换 机 。 虽 然 交换 机 是 瓶颈 所 在 ， 但 是 它 提供 了 出 色 的 连通 性 。 线 性 或 环形 网 络 允 许 
每 个 组 件 直接 与 两 个 相 邻 的 组 件 进 行 通 信 ， 但 与 其 他 的 通信 不 得 不 经 过 多 个 组 件 才能 到 达 目 的 
地 。( 环 形 网 络 是 线性 网 络 的 一 个 特例 ， 在 该 网 络 中 两 个 端 组 件 直接 相连 。) 在 网 状 网 络 中 ， 每 
个 组 件 与 其 相 邻 的 4 个 或 6 个 组 件 相连 (这 取决 于 是 二 维 结构 还 是 三 维 结构 ) 。 这 种 网 络 的 变种 
有 环形 网 状 网 络 ， 就 好 像 线性 网 络 能 够 通过 首尾 相 接 构成 环形 网 络 。 

在 树 形 网 络 中 ， 组 件 构 成 了 非 环 状 结构 ， 因 此 与 根部 组 件 的 通信 是 瓶颈 所 在 。 超 立方 体 网 
络 是 网 状 网 络 的 多 维 扩展 ， 在 每 一 维 中 有 两 个 处 理 器 ( 超 立 方 体 网 络 通常 是 对 处 理 器 进行 连接 ， 
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而 不 是 对 处 理 咒 - 存储 器 进行 连接 ) 。 二 维 超 立 方 体 包含 若干 个 处 理 器 对 ， 当 且 仅 当 它 们 标签 
的 二 进 制 表 示 仅 有 一 位 不 同时 ， 它 们 之 间 通 过 一 条 直接 链 路 进行 连接 。 在 n 维 超 立 方 体 中 ， 每 
个 处 理 咒 直接 与 其 他 4 个 处 理 器 相连 。 需 要 注意 的 是 ， 在 超 立 方 体 的 每 两 个 标签 中 二 进 制 表示 
不 同位 数 间 的 距离 称 为 汉 明 距离 ， 它 也 可 用 来 表明 两 个 处 理 器 间 最 短路 径 的 通信 和 链 路 数目 。 图 9- 
3 给 出 了 各 种 类 型 的 静态 网 络 。 








b ) 星 形 
HE 
c ) 线性 和 环形 d ) 网 状 和 网 状 环 





e ) 树 形 f) 四 维 超 立 方 体 
图 9-3 静态 网 络 的 拓扑 结构 


动态 网 络 可 以 通过 两 种 方式 对 网 络 进行 动态 配置 : 总 线 
方式 或 开关 方式 。 当 成 本 是 主要 考虑 因素 时 ， 如 图 9-4 所 i 
示 ， 基 于 总 线 的 网 络 是 最 简单 最 高 效 的 ， 它 能 够 连接 中 等 规 总 线 
模 的 组 件 。 很 明显 ， 总 线 的 最 大 问题 是 当 需 要 连接 的 组 件 越 
来 越 多 时 ， 对 总 线 的 竞争 将 成 为 瓶颈 。 并 行 总 线 可 有 效 缓解 
这 一 问题 ， 但 成 本 也 会 相应 地 提高 。 I 
开关 网 络 通过 开关 来 动态 地 改变 路 由 。 有 两 种 类 型 的 开关 网 络 : 交叉 开关 和 2 x2 开关 
交叉 开关 是 一 种 简单 的 开关 ， 它 要 么 打开 ， 要 么 关闭 。 通 过 闭合 任何 组 件 间 的 开关 实现 连接 。 
由 交叉 开关 组 成 的 网 络 是 全 连接 的 ， 因 为 任何 组 件 都 可 以 和 其 他 任意 组 件 进行 通信 ， 并 且 不 同 
处 理 器 /存储 器 对 间 可 以 同时 通信 。( 但 一 个 给 定 的 处 理 器 在 任意 时 刻 最 多 只 能 选 通 一 个 连 
接 ) 。 只 要 开关 保持 闭合 ， 那 么 就 不 会 阻 断 数据 传输 。 因 此 ， 交 又 开关 网 络 是 非 阻塞 网 络 。 然 
而 ， 如 果 在 每 个 交叉 点 都 设 导 一 个 开关 ， 那么 个 组 件 需 避 个 开关 。 在 实际 设计 中 , 许多 的 
多 处 理 器 架构 需要 在 每 个 交叉 点 设置 多 个 开关 。 因 此 ,管理 如 此 众多 的 开关 会 变 得 十 分 困难 ， 
而 且 成 本 也 将 十 分 高 。 实 际 上 ， 交 又 开关 仅 用 于 高 速 的 多 处 理 器 向 量 计算 机 中 。 一 种 交叉 开关 
的 配置 如 图 9-5 所 示 。 有 阴影 的 开关 表示 闭合 开关 。 一 个 处 理 器 在 某 个 时 刻 仅 能 连接 一 个 存储 
器 ， 因 此 每 列 最 多 有 一 个 闭合 的 开关 。 




















图 9-5 交叉 开关 网 络 


第 二 种 类 型 开关 是 2 x2 开关 。 它 与 交叉 开关 十 分 相似 ， 区 别 在 于 它 能 够 将 输入 路 由 到 不 
同 的 目的 地 ， 而 交叉 开关 只 能 简单 地 打开 或 关闭 通信 通道 。 一 个 2 x2 交换 开关 有 两 个 输入 和 
两 个 输出 。 在 任意 时 刻 ， 一 个 2 x2 开关 会 出 现 4 种 状态 : 直通 、 交 叉 、 上 广播 和 下 广播 ， 如 
图 9-6 所 示 。 在 直通 状态 ， 靠 上 的 输入 与 靠 上 的 输出 相连 ， 靠 下 的 输入 与 靠 下 的 输出 相连 。 简 
言 之 ,就 是 输入 直接 通过 开关 。 在 交叉 状态 ， 靠 上 的 输入 与 靠 下 的 输出 相连 ， 靠 下 的 输入 与 靠 
上 的 输出 相连 。 在 上 广播 状态 ， 靠 上 的 输入 广播 到 靠 上 的 输出 和 靠 下 的 输出 。 在 下 广播 状态 ， 
靠 下 的 输入 广播 到 靠 上 的 输出 和 靠 下 的 输出 。 直 通 状态 和 交叉 状态 是 与 互连网 络 相 关 的 。 

最 先进 的 网 络 多 级 互连网 络 ， 就 建立 在 2 x2 开关 之 上 。 其 核心 思想 是 合并 每 个 阶段 的 开 
关 ， 将 处 理 器 和 存储 器 放置 在 网 络 的 两 端 ， 以 交换 开关 作为 中 间 节 点 。 这 些 开 关 可 动态 配置 以 
构建 任意 处 理 器 和 任意 存储 器 之 间 的 通信 路 径 。 开 关 数 目 和 级 数 决定 了 每 条 通信 信道 上 的 路 径 
长 度 。 当 配置 开关 以 实现 从 源 端 到 目的 端的 消息 传递 时 会 产生 少量 的 延 时 。 这 些 多 级 网 络 通常 
称 为 洗 牌 网 络 ， 以 比喻 开关 间 的 连接 模式 。 

许多 拓扑 结构 采用 了 多 级 交换 网 络 。 这 些 网 络 可 在 松 耦 合 分 布 式 系统 中 连接 处 理 器 ， 或 在 
紧 耦 合 系统 中 控制 处 理 器 和 存储 器 之 间 的 通信 。 一 个 开关 在 某 个 时 刻 只 能 处 于 一 种 状态 ， 因 此 
会 出 现 阻塞 。 例 如 ， 如 图 9-7 所 示 ， 考 虑 一 种 简单 的 多 级 交换 网 络 拓扑 结构 一 一 Omega 网 络 。 
如 果 开 关 1A 和 2A 设置 为 直通 状态 ，CPU00 将 与 存储 模块 00 进行 通信 。 然 而 ， 此 时 CPU10 就 
不 可 能 和 存储 模块 01 进行 通信 。 为 了 实现 两 者 间 的 通信 ,开关 1A 和 2A 必须 设置 为 交叉 状态 。 
因此 ，Omega 网 络 是 阻塞 网 络 。 通 过 增加 更 多 的 开关 和 更 多 的 级 数 可 以 构建 非 阻 塞 多 级 网 络 。 
一 般 说 来 ， 具 有 个 节点 的 Omega 网 有 log,n 级 ， 每 级 有 n/2 个 开关 。 


a ) 直通 b ) 交叉 





e) 上 广播 d) 下 广播 
图 9-6 2x2 开关 的 状态 图 9-7 两 级 Omega 网 络 
值得 注意 的 是 ,配置 开关 并 不 像 看 起 来 那么 困难 。 目 的 模块 的 二 进 制 表示 可 以 在 消息 传递 
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时 对 开关 进行 编程 。 每 个 开关 可 以 基于 每 阶段 目标 地 址 中 的 一 位 进行 编程 。 如 果 该 位 为 0， 则 
输入 路 由 到 靠 上 的 输出 。 如 果 该 位 为 1， 则 输入 路 由 到 靠 下 的 输出 。 例 如 ,假设 CPU00 试图 与 
存储 模块 01 进行 通信 。 我 们 可 以 使 用 目的 地 址 的 第 1 位 (0) 将 开关 1A 设置 为 直通 状态 (将 输 
入 路 由 到 靠 上 的 输出 ) ， 并 且 使 用 第 2 位 (1) 将 开关 2A 设置 为 交叉 状态 (将 输入 路 由 到 靠 下 的 
输出 ) 。 如 果 CPU11 试图 与 存储 模块 00 通信 ， 我 们 可 以 将 开关 1B 和 2A 设置 为 交叉 状态 (因为 
两 个 输入 都 需要 路 由 到 靠 上 的 输出 ) 。 

另 一 种 对 开关 进行 设置 的 方法 是 比较 源 和 目的 的 相关 位 。 如 果 相 关 位 相同 ， 则 开关 被 设置 
为 直通 状态 。 如 果 相 关 位 不 同 ， 则 开关 被 设置 为 交叉 状态 。 例 如 ， 假 设 CPU00 试图 与 存储 模 
块 01 进行 通信 。 我 们 比较 它们 的 第 1 位 (0 到 0)， 并 设置 开关 1A 为 直通 状态 ， 比 较 第 2 位 (0 
到 1), 设置 开关 2A 为 交叉 状态 。 

每 种 对 多 处 理 器 进行 互 连 的 方法 都 有 优点 和 缺点 。 例 如 ， 当 处 理 需 数目 为 中 等 规模 时 ， 基 
于 总 线 的 网 络 最 简单 ， 也 最 有 效 。 然 而 ， 如 果 多 个 处 理 器 同时 发 出 访 存 请 求 ， 则 总 线 将 成 为 瓶 
有 贷 。 我 们 在 表 9-2 中 对 总 线 、 交 义 开 关 和 多 级 互连网 络 进行 了 比较 。 


表 9-2 各 种 互连网 络 的 属性 























9. 4.4 共享 存储 器 的 多 处 理 器 


我 们 之 前 提 到 过 多 处 理 器 可 以 根据 存储 器 的 组 织 形 式 进行 分 类 。 紧 耦合 系统 使 用 同一 个 存 
储 器 ， 因 此 称 为 共享 存储 器 的 多 处 理 器 。 这 并 不 是 说 所 有 的 处 理 器 必须 共享 一 个 大 容量 存储 
器 。 每 个 处 理 器 可 以 有 本 地 存储 器 ， 但 该 存储 器 必须 和 其 他 处 理 器 共享 。 也 可 以 将 本 地 缓存 与 
全 局 存储 器 一 起 使 用 。 图 9-8 给 出 了 3 种 共享 多 处 理 器 的 架构 。 

共享 存储 器 多 处 理 器 (SMM ) 的 概念 出 现在 20 世纪 70 年 代 。 第 一 台 SMM 计算 机 由 卡耐基 
梅 隆 大 学 设计 ， 使 用 交叉 开关 连接 16 个 处 理 器 和 16 个 存储 模块 。 早 期 最 被 看 好 的 SMM 计算 
机 是 cm* 系统 ， 配 有 16 个 PDP-11 处 理 器 和 16 个 存储 模块 ， 并 通过 树 形 网 络 进 行 连接 。 全 局 
共享 存储 器 被 平均 分 配给 每 个 处 理 器 。 如 果 一 个 处 理 器 生成 一 个 地 址 ， 则 它 会 首先 检查 本 地 存 
储 器 。 如 果 该 地 址 不 在 本 地 存储 器 中 ,， 则 它 应 被 传送 到 控制 咒 。 控 制 器 会 在 以 该 处 理 器 为 根 节 
点 的 子 树 的 所 有 处 理 器 中 定位 该 地 址 。 如 果 所 需 地 址 还 没有 定位 ， 则 请 求 继续 沿 树 传递 直到 找 
到 数据 或 超出 了 系统 的 寻 址 范围 。 

目前 还 有 一 些 商用 的 SMM 机 器 ， 但 它们 并 不 是 很 流行 。 第 一 个 商用 的 SMM 计算 机 是 BBN 
(Bolt 、Beranek 和 Newman ) 的 Butterfly ， 使 用 了 256 个 摩托 罗拉 的 68 000 处 理 器 。KSR-1( 来 自 
Kendall Square 研究 中 心 ) 是 近期 出 现 的 SMM， 主 要 用 于 科学 计算 应 用 。 每 个 KSR-1 处 理 器 包含 
一 个 缓存 ， 但 系统 没有 主 存 。 通 过 每 个 处 理 器 所 维护 的 缓存 目录 可 以 访问 数据 。KSR-1 中 的 处 
理 单元 通过 一 个 单 向 环形 拓扑 网 络 进行 连接 ， 如 图 9-9 所 示 。 消 息 和 数据 在 环形 网 络 中 只 能 沿 
一 个 方向 传播 。 每 个 一 级 环 可 连接 8 ~ 32 个 处 理 溪 。 一 个 二 级 环 最 多 可 连接 34 个 一 级 环 ， 最 
多 支持 1088 个 处 理 器 。 当 一 个 处 理 器 访问 位 于 地 址 x 中 的 数据 时 ， 包 含 地 址 x 的 处 理 器 缓存 将 
一 个 所 需 的 缓存 槽 放 到 环形 网 络 上。 相应 的 缓存 条 目 ( 包 含 数据 ) 沿 着 环 传输 ， 直 到 到 达 发 出 
请 求 的 处 理 器 。 这 种 分 布 式 共享 存储 系统 称 为 共享 虚拟 存储 器 系统 。 





中 存 估 举国 存储 器 


CPU2 CPU3 






b ) 分 布 式 共享 存储 器 结构 


c ) 处 理 器 中 带 有 独立 缓存 的 全 局 共享 存储 器 结构 
图 9-8 共享 存储 器 的 配置 





图 9-9 ”KSR-1 环形 拓扑 结构 
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共享 存储 器 的 MIMD 机 器 根据 如 何 同步 访 存 操作 可 分 为 两 种 类 型 。 在 均匀 存储 器 访问 
(UMA) 系统 中 ， 所 有 的 访 存 操作 花费 相同 的 时 间 。UMA 机 器 有 一 个 大 容量 的 共享 存储 器 ， 通 
过 总 线 或 交换 网 络 与 一 组 处 理 器 相连 。 根 据 互 连 网 络 协 议 ， 所 有 的 处 理 器 具有 相同 的 访问 时 
间 。 在 UMA 机 器 中 ， 随 着 处 理 器 数目 的 增加 ， 交 换 式 互连网 络 ( 需 要 2"” 个 连接 ) 的 成 本 也 迅速 
提升 。 当 总 线 带 宽 无 法 满足 系统 中 处 理 器 数目 的 需求 时 ， 基 于 总 线 的 UMA 系统 将 处 于 饱和 状 
态 。 多 级 网 络 则 将 受到 线 延 迟 的 约束 ， 如 果 处 理 器 的 数目 过 多 ， 则 会 产生 明显 的 传输 延 时 。 因 
此 ，UMA 机 器 的 扩展 能 力 受 到 了 互连网 络 属性 的 制约 。 对 称 多 处 理 器 属于 UMA 架构 。 现 实 中 
UMA 机 器 包括 Sun 公司 的 Ultra Enterprise 、IBM 的 iSeries 和 pSeries 服务 器 、 惠 普 900 以 及 DEC 
公司 的 AlphaServer。 

非 均匀 存储 器 访问 (NUMA) 系统 为 每 个 处 理 器 配备 一 个 私有 的 存储 器 ， 从 而 有 效 避 免 了 
UMA 体系 结构 中 固有 的 问题 。NUMA 机 器 中 的 存储 空间 分 布 在 各 个 处 理 器 上 ， 但 从 处 理 器 的 
角度 来 看 这 是 一 个 连续 的 存储 空间 。 虽 然 NUMA 中 的 存储 器 由 统一 的 可 寻 址 空间 构成 ， 但 其 分 
布 式 特性 不 是 完全 透明 的 。 一 个 处 理 器 访问 距离 近 的 存储 器 所 花费 的 时 间 比 访问 距离 远 的 存储 
器 要 短 。 采 用 NUMA 结构 的 机 器 包括 Sequent 的 NUMA-Q 和 Silicon Graphics 的 Origin2000 。 

NUMA 机 器 容易 出 现 缓存 一 致 性 问题 。 为 了 减少 访 存 时 间 ，NUMA 中 的 每 个 处 理 器 都 维护 
一 个 私有 缓存 。 然 而 ， 当 某 个 处 理 器 修改 了 位 于 本 地 缓存 中 的 一 个 数据 ， 则 该 数据 的 拷贝 将 不 
再 一 致 。 例 如 ,假设 处 理 器 A 和 处 理 器 B 在 它们 各 自 的 缓存 中 都 拥有 一 个 数据 x 的 副本 。 假 设 
x 的 值 为 10。 如 果 处 理 器 A 将 x 赋值 为 20， 则 处 理 器 B 的 缓存 中 存储 的 为 x 的 旧 值 (仍然 为 
10) 。 这 种 数据 不 一 致 性 是 不 允许 的 ， 因 此 必须 提供 相应 的 机 制 来 保证 缓存 一 致 性 。 一 个 专门 
设计 名 为 监听 ( snoopy ) 缓存 控制 器 的 硬件 单元 ， 将 监控 系统 中 的 所 有 缓存 。 它 实现 了 系统 的 
缓存 一 致 性 。 采 用 监听 ( snoopy) 缓 存 ， 并 维护 缓存 一 致 性 的 NUMA 机 器 称 为 缓存 一 致 性 NUMA 
(CC-NUMA) 体 系 结构 。 

最 早 解 决 缓存 一 致 性 的 方法 是 让 含有 旧 值 的 处 理 器 将 它 缓存 中 的 x* 设置 为 无 效 或 将 其 更 新 
为 新 值 。 若 在 x 一 发 生 改变 就 进行 新 值 更 新 ， 则 称 这 样 的 系统 采用 了 写 直通 缓存 更 新 策略 。 在 
这 种 方法 中 数据 会 同时 写 和 人 缓存 和 内 存 中 。 如 果 采 用 了 写 直 通 更 新 策略 ， 一 个 含有 x 新 值 的 消 
息 会 广播 到 其 他 所 有 缓存 控制 器 中 ， 以 确保 对 其 他 x 副本 进行 更 新 。 如 果 采 用 写 直 通 无 效 策 
略 ， 则 广播 中 会 包含 一 个 消息 ， 这 个 消息 让 所 有 缓存 控制 器 从 它们 的 缓存 中 将 x 旧 值 删除 。 写 
无 效 策略 仅 在 x 第 一 次 更 新 时 使 用 网 络 ， 因 此 总 线 负载 比较 轻 。 写 更 新 策略 维护 所 有 的 缓存 ， 
降低 了 延迟 ， 然 而 ， 它 增加 了 通信 和 量 。 

第 二 种 维护 缓存 一 致 性 的 方法 是 写 回 策略 ， 它 在 数据 发 生变 化 时 仅 改变 缓存 中 的 值 。 主 存 
中 的 副本 直到 其 所 对 应 的 缓存 块 被 替换 并 写 回 主 存 时 才 发 生 改 变 。 对 于 这 种 策略 ， 数 据 已 正常 
方式 进行 读 取 ， 但 在 写 人 数据 前 ， 执 行 写 操作 的 处 理 器 必须 独占 该 数据 。 因 此 ， 它 必须 先 取得 
数据 的 使 用 权 。 在 获得 使 用 权 后 ， 其 他 处 理 器 中 该 数据 的 副本 会 被 置 为 无 效 。 如 果 其 他 处 理 咒 
希望 读 取 这 个 数据 ， 则 它 必须 向 拥有 该 数据 的 处 理 器 发 出 请 求 ， 然 后 ， 拥 有 这 个 处 理 器 放弃 该 
数据 ， 并 将 它 存 回 主 存 。 


9.4.5 分 布 式 计算 

分 布 式 计算 是 男 一 种 形式 的 多 处 理 器 。 虽 然 它 已 经 成 为 十 分 流行 的 计算 资源 ， 但 对 于 不 同 
的 使 用 者 ， 分 布 式 计 算 意 味 着 不 同 的 含义 。 在 某 种 意义 上 ， 所 有 的 多 处 理 器 系统 也 都 是 分 布 式 
系统 ， 因 为 工作 负载 划分 到 一 组 处 理 器 上 ， 并 通过 相互 协同 来 完成 对 问题 的 求解 。 当 大 部 分 人 
使 用 分 布 式 系统 这 个 词 时 ， 他 们 主要 是 指 松 耦 合 的 多 计算 机 系统 。 回 想 一 下 可 知 ， 多 处 理 器 可 
以 通过 图 9-8c 所 示 的 局 部 总 线 进行 连接 ， 也 可 以 通过 图 9-10 所 示 的 互连网 络 进行 连接 。 松 耦 
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合 分 布 式 计算 机 依靠 网 络 实现 多 个 处 理 器 之 间 的 通信 。 

这 种 想法 已 经 通过 个 人 微型 计算 机 和 
NOW 分 布 式 计算 系统 得 到 了 验证 。 这 些 系 
统 允 许 处 于 闲置 状态 的 PC 处 理 器 负责 一 个 
大 问题 中 的 一 小 部 分 计算 。 最 近 的 密码 问题 
借助 成 千 上 万 台 个 人 计算 机 得 到 了 人 解决， 每 
台 计 算 机 仅 针对 几 个 可 能 的 密 钥 进行 穷 举 式 
密码 分 析 。 

网 格 计算 是 一 个 很 好 的 分 布 式 计算 的 例 
子 。 网 格 计算 利用 连接 到 网 络 ( 通 常 是 因 特 
网 ) 中 的 众多 计算 机 资源 来 求解 一 个 复杂 的 
计算 问题 ， 而 这 个 问题 的 计算 规模 往往 是 任 
何 一 台 超级 计算 机 都 无 法 完成 的 。 网 格 计算 图 9-10 通过 网 络 连接 的 多 处 理 器 结构 
利用 了 分 布 在 不 同 地 点 并 属于 不 同 管理 域 的 
闲置 异 构 资 源 (一 般 是 CPU 或 磁盘 存储 器 )。 实 质 上 ， 网 格 计算 对 计算 资源 进行 了 虚拟 化 。 网 
格 计算 和 集群 计算 最 主要 的 不 同 是 ， 网 格 中 的 资源 不 一 定 全 在 同一 个 管理 域 中 ， 这 意味 着 网 格 
必须 支持 跨 不 同 实体 控制 的 管理 域 的 计算 。 主 要 的 挑战 是 建立 和 实施 合适 的 授权 技术 ， 以 允许 
远程 用 户 可 以 控制 所 在 域 之 外 的 计算 资源 。 

公共 资源 计算 也 称 为 全 局 计算 ， 是 一 种 特殊 的 网 格 计算 ， 其 计算 能 力 由 很 多 志愿 者 提供 ， 
并 且 其 中 很 多 人 都 是 匿名 的 。 它 充分 利用 数 百 万 个 人 计算 机 、 工 作 站 和 服务 器 的 空闲 时 刻 来 求 
解 复杂 问题 。 加 州 伯 克利 大 学 编写 的 开源 软件 使 得 各 类 研究 机 构 可 以 很 方便 地 在 世界 范围 内 使 
用 免费 提供 的 处 理 器 和 硬盘 资源 。 伯 克利 网 络 计 算 开 源 设施 ( BOINC ) 源 自 伯克利 若 名 的 SETI@ 
HOME 工程 。SETI@ HOME 分 析 来 自 射 电 望远镜 的 数据 ， 以 识别 表征 智能 通信 特征 的 模式 。 为 
了 使 用 该 工程 ， 个 人 计算 机 用 户 需要 在 他 们 的 计算 机 上 安装 一 个 SETI 屏幕 管理 器 。 屏 幕 管 理 
器 是 该 程序 的 一 部 分 ， 用 于 在 处 理 器 空闲 时 分 析 信 和 号 数据 。 当 个 人 计算 机 空闲 时 ，SETI 屏幕 
管理 器 从 SETI 服务 器 (使 用 硬盘 空间 ) 上 下 载 数据 ， 然 后 分 析 数 据 以 搜索 特征 模式 (使 用 CPU 
周期 ) ， 接 着 将 分 析 结 果 上 传 到 服务 器 ， 然 后 请 求 更 多 的 数据 。 在 这 个 处 理 过 程 中 ， 如 果 个 人 
计算 机 重启 之 前 的 任务 ， 则 会 暂停 屏幕 管理 程序 ， 然 后 在 个 人 计算 机 下 次 空闲 时 ， 屏 幕 管理 程 
序 从 中 断 处 继续 执行 。 按 照 这 种 方式 ， 处 理 过 程 与 用 户 应 用 不 会 发 生 冲 突 。 这 个 项 目 取得 了 巨 
大 的 成 功 ， 在 6 年 的 运行 期 内 累计 使 用 200 万 年 的 CPU 时 间 ， 分 析 了 50TB 的 数据 。 在 2005 年 
12 月 15 日 ,终止 了 SETIG@ HOME 项 目 ， 但 现在 在 BONIC 的 资助 下 ，SETI 再 次 被 完全 激活 。 除 
了 继续 SETI 的 工作 之 外 ，BONIC 项 目 还 包括 天 气 预 报 和 生物 医药 研究 。 

其 他 的 全 局 和 网 格 计算 还 关注 了 很 多 其 他 领域 ， 包 括 蛋 白质 折 释 、 癌 证 研究 、 天 气 模 型 、 
分 子 模型 、 金 融 模 型 、 地 震 模 拟 和 数学 问题 。 大 多 数 项 目 利 用 屏幕 管理 带 来 使 用 空 闻 的 处 理 右 
以 分 析 数 据 ， 否 则 这 些 工 程 将 需要 大 量 昂 贵 的 计算 资源 。 例 如 ，SETI 有 数 百 万 小 时 的 射电 望 
远 镜 数据 可 供 分 析 ， 而 癌症 研究 也 有 数 百 万 种 化 合 物 用 于 癌症 治疗 方法 。 如 果 没 有 网 格 计 算 ， 
即使 在 最 快 的 超级 计算 机 上 ， 求 解 这 些 问题 也 需要 花费 很 多 年 。 

对 于 普通 用 户 而 言 ， 透 明 性 的 概念 在 分 布 式 计算 中 是 十 分 重要 的 。 在 任何 可 能 的 时 候 ， 都 
应 当 隐藏 网 络 分 布 式 特性 的 相关 细节 。 使 用 远程 系统 资源 应 和 使 用 本 地 资源 一 样 便捷 。 这 种 透 
明 性 在 普 适 计算 系统 中 最 为 明显 ， 这些 系统 全 部 都 散人 到 环境 中 ,便于 使 用 量 全 互 连 ， 具 有 移 
动 性 和 不 可 见 性 。Mark Weiser 认为 是 普 适 计算 之 父 ， 曾 经 说 过 这 样 的 话 : 





普 适 计算 标志 着 第 三 波 计 算 的 到 来 。 第 一 波 是 主机 ， 每 台 主 机 都 将 由 很 多 用 户 所 共享 。 现 
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在 我 们 正 处 于 个 人 计算 时 代 ( 第 二 波 ) ， 人 类 和 机 器 通过 桌面 进行 不 顺畅 的 交流 。 当 技术 回归 
生活 之 后 ， 普 适 计算 (第 三 波 ) 时 代 或 者 是 平静 的 技术 时 代 ， 到 来 了 。 


Weiser 勾勒 了 个 体 与 成 百 台 计 算 机 在 同一 时 刻 进 行 互 动 的 场景 ， 每 台 计算 机 对 用 户 都 是 不 
可 见 的， 并 采用 无 线 网 络 进行 通信 。 取 代 个 人 计算 机 ， 我 们 可 通过 电话 或 家 用 电器 接 人 因 特 
网 ， 并 且 不 需要 用 户主 动 连接 因特网 ， 而 是 由 设备 完成 这 项 工作 。Weiser 将 伺服 电机 和 计算 
机 进行 了 比较 : 不 久之 前 ， 这 些 电 机 的 体积 还 是 很 巨大 的 ， 而 且 需 要 专门 的 维护 。 然 而 ， 目 
前 这 些 设备 已 经 变 得 很 小 ， 并 且 通 常 我 们 可 以 忽略 它们 的 存在 。 准 确 地 说 普 适 计算 的 目标 是 在 
我 们 的 环境 中 以 透明 的 方式 岩 入 许多 小 型 、 高 度 专用 的 计算 机 。 普 适 计算 的 例子 包括 可 穿戴 设 
备 、 智 能 教室 ， 以 及 环保 家 庭 和 办 公 室 。 尽 管 和 之 前 讨论 的 系统 不 同 ， 但 普 适 计算 仍 是 分 布 式 
计算 。 

分 布 式 计算 由 大 量 的 分 布 式 计算 基 础 设施 所 支持 。 远 程 过 程 调用 ( RPC) 延伸 了 分 布 式 计 
算 的 概念 ， 并 且 为 资源 共享 提供 了 必要 的 透明 性 。 利 用 RPC， 一 台 计 算 机 可 以 通过 过 程 调用 来 
使 用 另 一 台 计 算 机 上 的 可 用 资源 。 过 程 本 身 位 于 远程 机 器 上 ， 但 调用 过 程 就 好 像 是 在 系统 本 地 
完成 一 样 。 微 软 的 分 布 式 组 件 对 象 模型 ( DCOM) 、 开 放 组 的 分 布 式 计算 环境 (DCE) 、 公 共 对 象 
请 求 代理 体系 结构 (CORBA) ， 以 及 Java 的 远程 方法 调用 (RMI) 都 是 用 RPC 的 。 当 今 的 软件 设 
计 者 正在 学 习 面 向 对 象 的 分 布 式 计算 ， 这 催生 了 DCOM 、CORBA 、RMI 和 SOAP 的 流行 。SOAP 
[最 初 是 简单 对 象 访问 协议 (Simple Object Access Protocol) 的 缩写 , 但 最 近 加 入 到 了 新 修 定 的 协 
议 中 ] 使 用 XML( 可 扩展 标记 语言 ) 来 封装 数据 ， 封 装 的 数据 会 发 送 到 远程 过 程 ， 后 者 从 远程 过 
程 接 收 封装 的 数据 。 虽 然 任 何 传输 方式 都 可 以 为 一 个 SOAP 调用 所 使 用 ,但 HTTP 仍然 是 最 流 
行 的 方式 。 

一 种 新 出 现 的 分 布 式 计 算是 我 们 在 第 1 章 中 提 到 过 的 云 计算 。 云 计算 关注 的 计算 服务 是 一 
组 由 松 耦 合 系统 提供 的 ， 这 些 系统 通过 因特网 “ 云 ” 连 接 到 服务 使 用 方 。 计 算 服 务 的 使 用 方 
( 即 客户 端 ) ， 理 论 上 不 知道 或 不 关心 提供 服务 的 具体 硬件 设备 。 因 此 ， 客 户 端 所 看 到 的 云 仅 
是 它 所 提供 的 服务 。 在 特定 的 云 (实际 上 是 位 于 某 处 的 服务 器 群 ) 中 ， 第 一 个 可 用 系统 在 每 个 
服务 请 求 到 来 的 时 候 处 理 它们 。 许 多 优质 云 在 系统 间 提 供 元 余 性 和 可 扩展 性 ， 因 此 ， 它 们 支持 
良好 的 故障 恢复 和 响应 时 间 。 

云 计算 不 同 于 传统 的 分 布 式 计算 ,因为 云 本 身 定义 了 它 所 提供 的 服务 ， 而 不 是 由 部 署 了 应 
用 的 某 个 硬件 架构 所 决定 的 。 云 隔离 了 服务 供应 方 和 服务 使 用 方 。 因 此 ， 它 便于 外 包 通 用 的 商 
业 服 务 ， 如 会 计 和 工资 单 。 使 用 了 云 的 企业 就 可 以 这 么 做 ， 因 为 这 意味 着 公司 不 需要 为 购买 和 
维护 使 用 这 个 应 用 的 服务 器 而 担心 。 公 司 仅 需 购买 它们 实际 使 用 的 服务 。 使 用 云 计算 的 企业 十 
分 关心 安全 和 隐私 ， 当 因特网 成 为 计算 基础 设施 的 一 部 分 时 ， 这 些 问 题 将 更 加 凸显 。 


9.5 其 他 的 并 行 处 理 方法 

本 书 旨 在 讨论 特定 的 高 级 体系 结构 。 虽 然 不 可 能 讲 括 所 有 的 细节 ， 但 我 们 还 是 要 向 你 介绍 
一 些 值得 关注 的 ， 不 同 于 汉 “' 诺 依 曼 架构 的 系统 。 这 些 系统 以 新 颖 的 方式 实现 了 计算 机 和 计 
算 。 它 们 包括 数据 流 计算 、 神 经 网 络 和 脉动 处 理 。 


9. 5. 1 数据 流 计算 

冯 ，… 诺 依 曼 计算 机 采用 顺序 控制 流 。 程 序 计数 器 决定 下 一 条 需要 执行 的 指令 。 数 据 和 指令 
相 分 离 。 数 据 可 以 改变 程序 执行 顺序 的 唯一 方式 是 程序 计数 器 中 的 值 根据 引用 该 数据 值 的 语句 
发 生 了 改变 。 

在 数据 流 计算 中 ， 程 序 的 控制 流 直接 与 数据 绑 定 。 这 个 方法 很 简单 : 当 一 条 指令 所 需要 的 
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数据 都 准备 好 后 ， 就 可 以 执行 该 条 指令 。 因 此 ， 指 令 的 实际 顺序 与 它们 最 终 的 执行 顺序 无 关 。 
执行 流 完全 由 数据 依赖 性 决定 。 在 这 样 的 系统 中 没有 共享 数据 存储 的 概念 ， 也 不 用 程序 计数 器 
来 控制 程序 的 执行 。 数 据 持续 流出 ， 并 且 在 同一 时 刻 可 以 被 多 条 指令 所 用 。 每 条 指令 都 认为 是 
一 个 单独 的 进程 。 指 令 不 访问 存储 器 ， 但 它们 会 访问 其 他 指令 。 数 据 从 一 条 指令 传输 到 另 一 条 
指令 。 

我 们 可 以 通过 数据 流 图 来 理解 数据 流 计 算 机 的 计算 序列 。 在 数据 流 图 中 ， 节 点 表示 指令 ， 
边 表示 指令 间 的 数据 依赖 关系 。 数 据 以 数据 令 牌 的 形式 流 过 数据 流 图 。 当 一 条 指令 得 到 了 所 需 
要 的 所 有 数据 令 牌 后 ， 会 激活 图 中 的 对 应 节点 。 当 一 个 节点 激活 后 ， 它 就 在 这 些 数据 令 牌 上 执 
行 相应 的 操作 ， 然 后 将 含有 结果 的 数据 令 牌 传输 到 输出 边 上 。 上 述 过 程 如 图 9-11 所 示 。 

图 9-11 所 示 的 数据 流 图 是 一 个 静态 数据 流体 系 结构 的 例子 ， 在 该 例 中 令 牌 以 分 段 流 水 的 
方式 流 过 该 图 。 在 动态 数据 流体 系 结构 中 ， 令 牌 通过 上 下 文 信息 进行 标记 ， 并 存放 在 存储 器 
中 。 在 每 个 时 钟 周期 ， 搜 索 存 储 器 以 获得 激活 某 个 4 B 4 
节点 的 令 牌 集合 。 当 在 相同 的 上 下 文中 找到 了 一 个 二 Sd 
节点 所 需要 的 全 部 输入 令 牌 时 ， 激 活该 节点 。 

对 数据 流 计算 机 编写 的 程序 必须 使 用 针对 这 种 
架构 设计 的 语言 ， 它 们 包括 VAL、Id、SISAL， 以 及 CD Cas 


LUCID。 数 据 流程 序 的 编译 结果 是 一 个 与 图 9-11 所 + NN、 pA 六 

示 内 容 类 似 的 数据 流 图 。 当 程序 执行 时 ， 令 牌 沿边 

进行 传播 。 人 
考虑 下 面 计算 N! 的 代码 示例 : WB 
(initial 3 «~ ny Kk <- 1 图 9-11 计算 N=(4+B)x(B-4) 的 
while j > 1 do 数据 流 图 


new Kk <- Kk * j; 
new j <-j-1; 
return Kk) 


相应 的 数据 流 图 如 图 9-12 所 示 。N 和 1 被 送 入 图 中 ,WN 变 为 令 牌 j。 7 与 1 进行 比较 ， 如 果 大 于 
1， 则 令 牌 7 继续 传递 ， 并 复制 成 两 份 ， 其 中 一 份 传输 到 “ - 1 节点 ”， 另 一 份 传递 给 乘法 节点 。 
如 果 j 小 于 或 等 于 1， 则 上 的 值 为 程序 输出 。 乘 法 节点 仅 当 一 个 新 的 令 牌 j 和 新 的 令 牌 都 可 用 
时 才 激 活 。N 和 1 送 入 的 “向 右 ” 的 三 角形 是 “合并 ”节点 ， 当 任意 一 个 输入 可 用 时 就 会 激 
活 它 。 一 旦 NN 和 1 送 入 图 中 ,它们 会 被 “使 用 ”"”， 并 且 产 生 新 的 和 儿 以 激活 合并 节点 。 





图 9-12 计算 N! 的 数据 流 图 


犹他 大 学 的 AL Davis 在 1977 年 发 明了 第 一 台数 据 流 机 。 第 一 个 多 处 理 器 数据 流 系统 (包含 
32 个 处 理 器 ) 于 1979 年 在 法 国 CERT-ONERA 设计 成 功 。 曼 彻 斯 特大 学 于 1981 年 设计 了 第 一 台 
令 牌 数据 流 计算 机 。 商 用 的 曼彻斯特 标记 数据 流 模 型 是 一 个 强大 的 ， 基 于 动态 标记 的 数据 流 范 
例 。 这 种 特定 的 体系 结构 被 描述 为 标记 ， 因 为 数据 值 ( 令 牌 ) 通 过 唯一 标识 符 来 标记 以 指出 当 
前 的 迭代 级 别 。 之 所 以 需要 令 牌 是 因为 程序 可 重 入 ， 这 意味 着 同样 的 代码 可 用 于 不 同 的 数据 。 
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通过 比较 标记 ， 系 统 决 定 在 每 次 迭代 中 使 用 哪些 数据 。 同 一 指令 中 与 标记 匹配 的 令 牌 将 激活 相 
应 的 节点 。 

循环 是 一 个 很 好 解释 标记 概念 的 例子 。 如 果 循 环 的 每 次 迭代 可 以 在 一 个 独立 的 子 图 上 执 
行 ， 则 可 以 在 更 高 层次 上 实现 并 发 。 这 个 子 图 是 图 的 简单 副本 。 然 而 ， 如 果 循 环 中 有 很 多 次 迭 
代 ， 则 会 产生 很 多 的 图 副本 。 除 了 复制 图 ， 更 有 效 的 方式 是 在 不 同 的 图 例 中 共享 节点 。 每 个 实 
例 中 的 令 牌 必须 是 可 识别 的 ， 这 可 以 通过 给 每 个 令 牌 分 配 一 个 标记 来 实现 。 每 个 令 牌 的 标记 可 
以 识别 出 它 属于 哪个 图 实例 。 也 就 是 说 ,属于 第 三 次 迭代 的 令 牌 不 会 激活 第 四 次 迭代 中 的 
节点 。 

数据 流 计算 机 体系 结构 包含 多 个 相互 通信 的 处 理 单元 。 每 个 处 理 单元 具有 一 个 使 能 单元 ， 
它 可 以 按 顺 序 接收 令 牌 ， 并 将 它们 保存 在 存储 器 中 。 如 果 这 个 令 牌 所 寻 址 的 节点 被 激活 ， 则 从 
存储 器 中 获取 输入 令 牌 ， 并 将 它们 与 节点 本 身 组 合 为 一 个 可 执行 包 。 处 理 单 元 中 的 功能 单元 计 
算 任 意 必需 的 输出 值 ， 并 将 它们 与 目的 地 址 进行 组 合 以 构成 更 多 的 令 牌 。 这 些 令 牌 会 被 再 送 回 
使 能 单元 ， 这 时 它们 就 可 以 用 于 激活 其 他 节点 了 。 在 标记 令 牌 机 器 中 ， 使 能 单元 被 分 割 为 两 个 
独立 阶段 : 匹配 单元 和 拾取 单元 。 匹 配 单元 在 它 的 存储 器 中 保存 令 牌 ， 并 决定 是 否 可 以 激活 一 
个 目的 节点 。 在 该 体系 结构 中 ， 目 标 节点 的 地 址 和 标记 必须 要 匹配 。 当 与 一 个 节点 匹配 的 所 有 
令 牌 都 可 用 时 ， 它 们 将 被 送 入 拾取 单元 ， 拾 取 单 元 将 这 些 令 牌 和 该 节点 的 副本 组 合 为 一 个 可 执 
行 包 ， 然 后 将 该 包 发 送 到 功能 单元 。 

因为 数据 驱动 数据 流 系统 进行 处 理 ， 所 以 数据 流 多 处 理 咒 不 会 遇 到 在 控制 驱动 的 多 处 理 器 
中 常 出 现 的 竞争 和 缓存 一 致 性 问题 。 值 得 关注 的 是 ， 冯 ' 诺 依 曼 的 名 字 在 传统 计算 机 体系 结构 
中 命名 了 汉 “ 详 依 曼 瓶 颈 ， 但 他 研究 了 数据 流 驱动 体系 结构 与 数据 流 机 器 间 的 相似 性 。 特 别 
是 ， 他 研究 了 神经 网 络 的 可 能 性 ,神经 网 络 本 质 上 是 数据 驱动 的 ,我 们 将 在 下 一 小 节 进 行 


讨论 。 


9.5.2 神经 网 络 


传统 体系 结构 十 分 擅长 快速 的 算术 运算 和 执行 确定 性 程序 。 然 而 ， 它 们 不 擅长 大 规模 并 行 
应 用 、 容 错 或 适应 变化 环境 。 另 一 方面 ， 当 不 能 通过 构造 一 个 准确 的 算法 进行 求解 的 问题 时 ， 
神经 网 络 是 十 分 有 用 的 ， 它 的 处 理 方式 是 基于 对 之 前 的 行为 进行 累加 。 

相 比 冯 ' 诺 依 曼 计算 机 基于 处 理 融 /存储 器 结构 ， 神 经 网 络 基于 人 脑 的 并 行 结构 。 它 试图 
实现 简化 版 的 生物 神经 网 络 。 神 经 网 络 代 表 了 男 一 种 形式 的 具有 高 度 互 连 性 和 简单 处 理 单元 的 
多 处 理 器 计算 。 它 们 能 够 处 理 非 精 确 的 和 概率 性 的 信息 ， 并 且 人 允许 处 理 器 单元 间 进 行 自 适应 交 
互 。 神 经 网 络 (也 称 为 神经 网 ) 类 似 生 物 网 络 ， 可 以 从 经 验 中 学 习 。 

神经 网 络 计算 机 由 大 量 简单 的 处 理 单元 组 成 ， 每 个 处 理 单元 负责 一 个 大 规模 问题 中 的 一 小 
部 分 。 简 单 地 说 ， 一 个 神经 网 络 包含 若干 个 处 理 单元 (PE) ， 每 个 PE 将 输入 与 对 应 的 权重 相 
乘 ， 最 后 求 和 输出 一 个 结果 。 这 些 计 算是 十 分 容易 的 。 神 经 网 络 的 真实 能 力 来 自 互 连 PE 的 并 
行 处 理 ， 以 及 权重 的 自 适 应 性 。 构 建 神经 网 络 的 难点 在 于 确定 哪些 神经 元 (PE ) 之 间 应 该 连接 ， 
确定 连接 边 上 的 权重 值 ， 以 及 确定 权重 的 各 种 阔 值 。 此 外 ， 当 一 个 神经 网 络 正在 学 习 时 ， 它 有 
可 能 出 错 。 当 发 生 错误 的 时 候 ， 必 须 修改 权重 值 和 国 值 来 纠正 这 个 错误 。 网 络 的 学 习 算 法 是 一 
组 用 来 管理 如 何 修 改 权 重 值 和 阅 值 的 规则 。 

神经 网 络 有 很 多 不 同 的 名 字 ， 包 括 互 连 系 统 、 自 适应 系统 和 并 行 分 布 式 处 理 系统 。 当 一 个 
大 规模 的 数据 库 可 以 被 神经 网 络 使 用 以 从 中 学 习 以 往 的 经 验 时 ， 这 些 系统 将 表现 出 十 分 强大 的 
功能 。 这 已 经 成 功 地 应 用 于 很 多 现实 世界 的 应 用 中 ， 包 括 质 量 控 制 、 天 气 预 报 、 金 融和 经 济 预 
报 、 语 音 和 模式 识别 、 石 油 和 天 然 气 开 采 、 医 疗 成 本 的 降低 、 破 产 预测 、 机 械 诊断 、 安 全 交 





易 ， 以 及 目标 营销 。 值 得 注意 的 是 ， 每 种 神经 网 络 都 需要 对 特定 任务 进行 专门 的 设计 ， 因 此 我 
们 不 能 将 一 个 用 于 天 气 预报 的 神经 网 络 用 于 金融 预报 。 

神经 网 络 最 简单 的 模型 是 感知 器 ， 它 是 单个 可 训练 的 
神经 元 。 一 个 感知 器 基于 接收 到 的 几 个 输入 生成 一 个 布尔 
值 输出 。 感 知 器 是 可 以 训练 的 ， 因 为 它 的 阔 值 和 输入 权重 
都 是 可 以 调整 的 。 图 9-13 给 出 了 一 个 带 有 nn 个 输入 x， 
x ，…，zt, 的 感知 器 ， 其 中 每 个 输入 可 以 是 布尔 值 也 可 以 
是 实数 值 。Z 是 布尔 型 输出 ; w, 表示 边 上 的 权重 ， 其 值 
为 实数 ; 7 表示 实数 阐 值 。 在 这 个 例子 中 ， 如 果 wx + ” 
wsxs +…+w,x。 比 闭 值 了 7 大 ， 则 输出 Z 为 真 (1)。 否 则 ，Z 图 9-13 一 个 感知 歼 
为 0。 

一 个 感知 器 根据 它 是 如 何 被 训练 的 ， 可 针对 特定 输入 产生 输出 。 如 果 训练 是 正确 的 ， 我 们 应 
该 可 以 给 它 任何 输入 ， 然 后 得 到 一 个 合理 的 正确 结果 。 感 知 器 应 该 能 够 确定 一 个 合理 的 结果 ， 即 
使 它 之 前 从 没有 处 理 过 这 些 特定 的 输入 。 输 出 的 “合理 性 ”取决 于 感知 器 被 训练 的 程度 。 

感知 器 可 以 通过 监督 或 非 监督 学 习 算 法 进行 训练 。 监 督学 习 假 定 已 经 知道 了 之 前 输入 的 正 
确 结果 ， 这 些 输入 -输出 对 在 训练 期 间 被 送 入 神经 网 络 。 在 它 学 习 时 ， 神 经 网 络 会 被 告知 最 终 
的 结果 是 否 是 正确 的 。 如 果 输 出 不 正确 ， 那 么 神经 网 络 会 调整 输入 权重 以 得 到 想 要 的 结果 。 非 
监督 学 习 在 训练 期 间 不 为 网 络 提供 正确 的 输出 结果 。 网 络 仅 对 它 的 输入 做 出 响应 ， 学 习 识 别 输 
入 数据 集 的 模式 和 结构 。 我 们 假设 在 例子 中 使 用 监督 学 习 。 

训练 神经 网 络 最 好 的 方法 就 是 使 用 尽 可 能 多 的 数据 ， 这 些 数据 应 尽 可 能 地 呈现 出 你 感 兴趣 
的 特征 。 神 经 网 络 的 优 劣 取决 于 训练 数据 ， 因 此 必须 选择 足够 多 的 正确 数据 。 例 如 ， 一 个 小 防 
仅仅 见 过 小 鸡 ， 那 么 你 不 可 能 要 求 他 认识 所 有 的 鸟 。 通 过 给 感知 器 施加 输入 来 进行 训练 ， 然 后 
检查 输出 。 如 果 输 出 不 正确 ， 则 感知 器 会 改变 它 的 权 值 和 效 值 以 避免 在 未 来 犯 同样 的 错误 。 此 
外 ， 即 使 我 们 给 一 个 小 孩 展示 了 小 鸡 、 麻 省 、 鸭 子 、 老 应、 鞠 酋 以 及 乌鸦 ， 我 们 也 不 能 要 求 小 
孩 在 看 过 一 次 后 就 记 住 它们 的 相同 点 和 不 同 点 。 类 似 地 ， 神 经 网 络 必须 对 同样 的 输入 数据 多 次 
学 习 后 才能 推断 出 输入 数据 的 特征 。 

一 个 感知 器 通过 训练 后 可 以 很 容易 地 识别 逻辑 AND 操作 。 假 设 有 个 输入 ， 当 且 仅 当 输 
入 都 为 1 时 ， 输 出 才 为 1。 如 果 感 知 器 的 阔 值 设置 为 nm， 并 且 所 有 边 上 的 权重 也 设置 为 1， 则 能 
够 得 到 正确 的 结果 。 另 一 方面 ， 为 了 计算 一 组 输入 的 逻辑 OR， 阔 值 将 设置 为 1。 这 样 ， 只 要 有 
一 个 输入 为 1， 输 出 就 为 1。 

对 于 AND 和 OR 操作 ， 我 们 能 够 直接 知道 阔 值 和 权重 是 什么 。 对 于 复杂 问题 ， 这 些 值 我 们 
就 不 得 而 知 了 。 例 如 ， 如 果 我 们 不 知道 AND 操作 的 权重 ， 那 么 可 以 先 将 权重 设置 为 0.5， 然 后 
将 各 种 输入 传人 感知 器 ， 当 产生 不 正确 的 结果 时 调整 权重 。 这 个 过 程 就 是 神经 网 络 的 训练 过 
程 。 一 般 说 来 ， 网 络 权重 会 被 初始 化 为 -1 ~ 1 之 间 的 值 。 正 确 的 训练 需要 成 千 上 万 步 ， 训练 
的 时 间 取 决 于 网 络 规模 。 随 着 感知 器 数目 的 增加 ， 可 能 的 “状态 ”数目 也 会 增加 。 

让 我 们 来 考虑 一 个 更 加 复杂 的 例子 ， 判 断 是 否 在 照片 中 隐藏 了 一 个 坦克 。 神 经 网 络 被 配置 
成 每 个 输出 都 与 一 个 像素 相关 联 。 如 果 像 素 是 坦克 图 像 的 一 部 分 ， 则 相应 的 输出 应 当 是 1， 否 
则 输出 是 0。 输 入 信息 最 有 可 能 包含 像素 的 颜色 。 通 过 对 神经 网 络 输入 多 幅 含 有 和 不 含有 坦克 
的 照片 进行 训练 ， 训 练 将 一 直 持续 到 网 络 可 以 正确 地 判断 出 照片 中 是 否 包含 坦克 。 

美国 军 方 开展 了 一 个 类 似 于 刚刚 描述 的 项 目 。100 张 照片 中 含有 在 树林 和 灌木 从 中 隐藏 的 
坦克 ， 以 及 另外 100 张 不 包含 坦克 的 普通 风景 照片 。 每 组 中 选择 50 张 照片 用 来 测试 ， 剩 下 的 
照片 用 于 训练 。 网 络 在 输入 图 片 前 通过 设置 随机 权重 进行 初始 化 。 如 果 网 络 的 输出 结果 不 正 
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确 ， 则 调整 输入 权重 直到 输出 正确 的 结果 。 在 训练 完成 后 ， 每 组 剩 下 的 50 张 测试 图 片 送 入 网 
络 。 神 经 网 络 可 以 正确 地 识别 出 每 张 照片 中 是 否 存在 坦克 。 

与 训练 有 联系 的 真正 问题 是 : 神经 网 络 实际 上 是 在 学 习 识别 坦克 吗 ? 政府 工作 人 员 的 怀疑 
引发 了 更 多 的 测试 。 更 多 的 照片 被 送 入 网 络 ， 令 研究 者 失望 的 是 结果 十 分 随机 。 神 经 网 络 不 能 
识别 照片 中 的 坦克 。 经 过 调查 ， 研 究 者 发 现在 原始 的 200 张 照片 中 ， 所 有 含有 坦克 的 照片 都 是 
在 多 云 的 情况 下 拍摄 的 ， 而 没有 坦克 的 照片 是 在 晴天 时 拍摄 的 。 神 经 网 络 能 够 区 分 这 两 组 图 片 
的 原因 ， 可 能 主要 是 使 用 了 天 空 的 颜色 作为 判断 依据 ， 而 不 是 是 否 存在 隐藏 的 坦克 。 政 府 可 以 
很 骄傲 地 拥有 一 个 昂贵 的 神经 网 络 ， 它 可 区 分 晴天 还 是 多 云 ! 

这 是 很 多 人 认为 神经 网 络 所 存在 的 最 大 问题 的 一 个 很 好 的 例子 。 如 果 有 超过 10 ~ 20 个 神 
经 元 ， 那 么 我 们 不 可 能 弄 明 白 网 络 是 如 何 得 到 结果 的 。 就 像 上 面 的 例子 ,我 们 不 可 能 知道 网 络 
是 否 是 基于 正确 的 信息 做 出 判断 的 。 神 经 网 络 具 有 从 复杂 数据 中 抽取 有 意义 的 信息 和 模式 的 能 
力 ， 而 这 些 复 杂 的 数据 是 人 类 无 法 分 析 的 。 一 些 人 将 神经 网 络 当 成 了 一 些 领域 的 专家 。 神 经 网 
络 在 如 下 领域 得 到 应 用 ， 它 包括 销售 预测 、 风 险 管理 、 客 户 研究 、 水 下 矿藏 勘探 、 人 脸 识 别 以 
及 数据 验证 。 虽 然 神经 网 络 是 十 分 有 前 途 的 ， 并 且 过 去 几 年 的 进展 使 得 对 神经 网 络 研究 获得 了 
很 多 资助 ， 但 许多 人 仍然 对 神经 网 络 中 一 些 人 类 无 法 弄 懂 的 事情 缺乏 信心 。 


9. 5.3 脉动 阵列 

脉动 阵列 计算 机 的 名 字源 自 一 个 类 比 ， 即 血液 如 何 有 节奏 地 流 过 心脏 。 它 们 是 一 个 由 处 理 
单元 构成 的 网 络 ， 这 些 处 理 单元 有 节奏 地 让 数据 循环 通过 系统 以 进行 计算 。 脉 动 阵列 是 SIMD 
计算 机 的 变种 ， 这 些 计算 机 包含 了 由 简单 处 理 器 构成 的 大 型 阵列 ， 这 些 处 理 器 针对 数据 流 使 用 
向 量 流水 线 ， 如 图 9-14b 所 示 。 自 从 脉动 阵列 于 20 世纪 70 年 代 出 现 以 来 ， 它 们 就 对 一 些 特定 
任务 有 很 好 的 效果 。 一 个 众所周知 的 脉动 阵列 是 CMU 的 iWarp 处 理 器 ， 它 于 1990 年 由 Intel 设 
计 。 这 个 系统 包含 了 一 个 由 双向 数据 总 线 连接 的 线性 阵列 处 理 器 。 





a ) 一 个 简单 的 处 理 单元 (PE ) b ) 一 个 脉动 阵列 处 理 器 
图 9-14 


虽然 图 9-14b 所 示 为 一 维 脉动 阵列 的 例子 , 但 二 维 脉 动 阵列 也 很 常见 。 随 着 VLSI 技术 的 
发 展 ， 三 维 阵列 也 逐渐 流行 起 来 了 。 

脉动 阵列 表现 出 了 高 度 的 并 行 性 (通过 流水 线 技 术 ) ， 并 且 能 够 维持 很 高 的 吞吐 量 。 连 接 
短 ， 并 且 设 计 简单 ， 因 此 具有 高 度 可 扩展 性 。 它 们 具有 强 鲁 棒 性 、 紧 凑 度 高 、 效 率 高 ， 以 及 生 
产 成 本 低 等 特点 。 男 一 方面 ， 它 们 是 高 度 定制 的 ， 因 此， 它们 不 能 对 求解 问题 的 种 类 和 规模 做 
出 灵活 适应 。 

多 项 式 求 值 一 个 使 用 脉动 阵列 的 很 好 例子 。 为 了 求解 多 项 式 y=ao +awxz t+ ar + +ax， 
我 们 能 够 使 用 Horner 规则 : 

(mT 

线性 脉动 阵列 可 以 用 来 通过 Horner 规则 进行 多 项 式 求 值 ， 在 此 阵列 中 处 理 需 会 成 对 出 现 ， 
如 图 9-15 所 示 。 一 个 处 理 器 将 它 的 输入 与 x 相 乘 ， 然 后 将 结果 向 右 传 递 (至 处 理 器 对 中 的 另 一 
个 ) 。 下 一 个 处 理 器 将 这 个 结果 加 上 a;， 然 后 将 求 和 的 结果 继续 向 右 传递 ( 至 下 一 个 处 理 器 )。 
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这 一 过 程 持 续 到 所 有 处 理 器 都 处 于 繁忙 状态 。 在 最 初 的 27 个 时 钟 周 期 后 ， 每 个 周期 都 可 以 得 
到 一 个 多 项 式 的 结果 。 


过 or 


3 Cn x | x Qh-12 
一 . 刻 秘 


图 9-15 利用 脉动 阵列 求解 多 项 式 


脉动 阵列 一 般 用 来 计算 重复 性 任务 ,包括 傅 里 叶 变 换 、 图 像 处 理 、 数 据 压 缩 、 最 短路 径 问 
题 、 排 序 、 信 号 处 理 以 及 各 种 和 矩阵 运算 ( 如 求 逆 和 乘法 )。 简 言 之 ,脉动 阵列 计算 机 特别 适合 
利用 大 量 简单 处 理 单元 进行 并 行 的 计算 问题 。 


9.6 量子 计算 

所 有 传统 的 计算 机 体系 结构 在 一 点 上 是 相同 的 : 它们 都 使 用 布尔 人 逻辑 ， 所 处 理 的 位 要 么 是 
1， 要 么 是 0。 从 基本 的 汉 ' 诺 依 曼 体 系 结构 到 最 复杂 的 并 行 处 理 器 系统 ， 都 是 基于 二 进 制 数 
学 运算 的 。 此 外 ， 每 种 计算 机 都 是 基于 晶体 管 技术 的 。 摩 尔 定 律 ( 即 芯片 上 集成 的 品 体 管 数目 
每 18 个 月 翻 一 番 ) ， 不 会 永远 有 效 。 物 理 定 律 告诉 我 们 最 终 唱 体 管 将 变 得 十 分 微小 ， 以 至 于 它 
们 之 间 的 距离 允许 电子 从 一 个 晶体 管 跳 到 另 一 个 晶体 管 ， 从 而 导致 致命 的 短路 。 这 就 要 求 我 们 
寻找 其 他 技术 方向 来 解决 这 些 问题 。 

一 种 可 能 的 方法 是 光 计 算 。 与 当前 计算 机 使 用 电子 执行 逻辑 运算 不 同 ， 光 计算 机 则 是 利用 
激光 中 的 光子 来 进行 操作 。 在 光 回 路 中 光 的 传播 速度 将 接近 光 在 真空 中 的 传播 速度 ， 并 且 没 有 
散热 问题 。 光 束 并 行 传输 的 特性 有 利于 提升 计算 速度 和 性 能 。 光 计算 机 的 投入 使 用 还 需要 很 多 
年 ， 如 果 它 真 出 现 了 ,很 多 人 仍 相 信 光 计算 仅 能 为 一 些 特殊 应 用 所 服务 。 

一 个 非常 有 前 途 的 技术 是 生物 计算 ， 它 将 利用 有 机 生物 体 的 组 件 来 蔡 代 无 机 的 硅 材 质 。 一 
个 有 关 生 物 计算 的 项 目 是 “leech-ulator”"， 这 是 一 台 美 国 科 学 家 制造 的 由 水 是 神经 元 构成 的 计 
算 机 。 另 一 个 生物 计算 的 例子 就 是 DNA 计算 ， 它 将 DNA 作为 软件 ， 酶 作为 硬件 。DNA 是 可 复 
制 、 可 编程 的 ， 这 样 可 以 执行 大 规模 并 行 任务 ， 最 先 处 理 的 任务 之 一 就 是 旅行 商 问 题 ， 其 并 行 
度 受 到 DNA 链 数 目的 限制 。DNA 计算 机 (也 称 为 分 子 计 算 机 ) 本 质 上 就 是 一 组 特殊 的 DNA 链 ， 
它们 一 次 就 可 对 多 种 求解 方法 进行 测试 ， 最 终 输 出 正确 结果 。 科 学 家 也 使 用 某 些 特定 的 细菌 进 
行 了 实验 ， 它 们 能 够 以 预测 的 方式 打开 和 关闭 遗传 因子 。 研 究 者 已 经 可 以 成 功 地 对 E. coli 细菌 
进行 编程 以 发 射 红 色 荧光 或 绿色 荧光 ( 即 0 或 1)。 

也 许 当前 最 有 意思 的 技术 就 是 量子 计算 。 传 统计 算 机 使 用 位 表示 开 、 关 两 种 状态 ， 而 量子 
计算 机 使 用 的 量子 位 (qubits) 可 以 同时 表示 多 种 状态 。 我 们 回忆 一 下 可 知 ， 在 电磁 场 中 ， 一 个 
电子 可 能 处 于 两 种 状态 : 电子 的 自 旋 与 磁场 方向 可 能 相同 或 相反 。 当 测量 这 种 自 旋 时 ， 我 们 可 
以 发 现 电 子 处 于 这 两 种 状态 之 一 。 然 而 ,质子 可 能 处 在 两 种 状态 的 重 双 位置， 这 时 每 种 状态 都 
会 出 现 。3 个 量子 位 可 以 同时 表示 数字 0 ~7 中 的 任何 一 个 ， 因 为 每 个 量子 位 都 有 可 能 处 在 量子 
合 加 态 。( 为 了 得 到 一 个 输出 值 ， 我 们 必须 对 量子 位 进行 测量 。) 因此 ，3 个 量子 位 可 以 同时 使 
用 所 有 的 可 能 值 进行 计算 ， 这 称 为 量子 并 行 。 带 有 600 个 量子 位 的 系统 可 以 表示 具有 2” 个 状 
态 的 量子 一 加 态 ， 这 在 传统 计算 机 体系 结构 上 是 无 法 仿真 的 。 除 了 比 传统 计算 机 快 10 亿 倍 之 
外 ， 量 子 计算 机 在 理论 上 不 需要 消耗 电能 。 

笃 加 态 并 不 新 颖 ， 它 只 是 简单 地 表示 两 种 事物 的 重 释 能力。 在 第 3 章 中 ， 当 介绍 时 钟 时 ， 
我 们 重 伙 多 个 时 钟 以 生成 一 个 具有 多 级 的 时 钟 。 重 番 正 弦 波 可 以 构造 一 种 新 的 组 合 波 形 。 一 个 
双 链 接 链 表 可 以 通过 将 当前 指针 和 左 指针 (也 可 以 是 右 指针 ， 这 取决 于 方向 ) 进行 异 或 操作 实 
现 遍 历 ， 而 下 一 个 需要 遍历 的 节点 地 址 就 是 释 加 位 置 。 时 钟 信号 的 倒 加 ， 正 弦 波 的 又 加 以 及 节 
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点 指针 的 又 加 就 是 量子 位 如 何 能 够 同时 保持 多 个 状态 的 原因 。 

D- Wave 计算 机 是 世界 上 第 一 款 制 造 和 出 售 的 量子 计算 机 。( 一 些 人 认为 这 个 计算 机 还 没有 
达到 量子 状态 ， 由 Jones 所 写 的 文章 给 出 了 更 多 的 相关 信息 。) 公 司 的 目的 就 是 挑战 科学 的 极限 ， 
利用 物理 学 领域 的 最 新 进展 构建 新 型 计算 机 。 借 助 量子 机 制 ，D- Wave 正在 构建 高 效 的 计算 机 ， 
使 其 计算 速度 超出 基于 晶体 管 技术 的 计算 机 。 这 些 计算 机 使 用 量子 位 (也 称 为 sqids 一 一 超 导 量 
子 干扰 器 件 ) 来 蔡 代 处 理 器 。 在 这 种 机 器 中 ， 一 个 量子 位 本 质 上 就 是 一 个 冷却 到 绝对 零度 的 金 
属 超 导 环 ， 量 子 电 流 可 以 在 其 中 以 顺 时 针 或 逆 时 针 方 向 流动 。 通 过 允许 电流 可 在 两 个 方向 上 流 
动 ， 区 分 它们 的 能 力 ， 因 此 可 以 同时 处 理 两 种 状态 。 量 子 位 与 其 他 对 象 进行 交互 ， 最 后 选择 出 

第 一 台 D-Wave 计算 机 卖 给 了 南 加 州 大 学 的 . Lockheed Martin 量子 计算 中 心 。 这 个 实验 室 主 
要 研究 量子 计算 的 工作 原理 。 南 加 州 大 学 使 用 这 人 台 机 器 进行 了 一 些 基础 研究 ， 并 对 如 下 一 些 问 
题 进 行 了 解答 ， 如 导致 量子 计算 错误 的 原因 有 哪些 ， 量 子 计 算 机 的 体系 结构 如 何 影 响 程序 员 对 
计算 的 理解 ， 以 及 如 何 增加 问题 规模 与 机 器 求解 时 间 之 间 的 关系 。 南 加 州 大 学 的 量子 计算 机 最 
开始 时 由 128 个 量子 位 组 成 ， 现 在 已 经 增加 到 了 512 个 量子 位 。 

在 2013 年 ， 谷 歌 为 由 NASA 资助 的 量子 人 工 智 能 实验 室 购 置 了 一 台 D- Wave 计算 机 。 不 同 
于 南 加 州 大 学 的 实验 室 ， 这 个 实验 室 用 这 人 台 机 器 来 运行 机 器 学 习 算法 。 这 台 D- Wave 计算 机 包 
含 512 个 超 导 量 子 位 。 这 台 计 算 机 的 编程 过 程 是 ， 用 户 分 配给 它 一 个 任务 ， 然 后 计算 机 利用 算 
法 将 运算 映射 到 各 个 量子 位 上 。 并 发 多 状态 能 力 使 得 D- Wave 计算 机 非常 适合 求解 组 合 优化 问 
题 ， 举 几 个 例子 ， 如 风险 分 析 、 车 辆 路 线 和 地 图 、 交 通 灯 同步 以 及 列车 调度 。 

一 个 有 意思 的 问题 是 : 究竟 什么 样 的 算法 可 以 在 量子 计算 机 上 运行 ? 答案 是 : 任何 可 以 在 
典型 冯 . 诺 依 曼 计算 机 ( 即 作为 这 种 体系 结构 的 经 典 机 器 在 量子 计算 机 界 是 众所周知 的 ) 上 运 
行 的 程序 都 可 以 在 量子 计算 机 上 运行 ; 毕竟 ， 就 像 任何 物理 学 家 都 可 以 证 明 的 ， 经 典 结构 是 量 
子 计算 的 子 集 。 另 一 个 问题 是 量子 计算 机 的 计算 能 力 相 比 经 典 结构 究竟 高 多 少 。 虽 然 ， 这 取决 
于 需要 求解 的 具体 问题 ， 但 研究 者 仍然 无 法 得 到 关于 这 个 问题 的 完整 答案 ， 因 为 大 部 分 量子 计 
算 机 所 能 完成 的 工作 已 经 超出 经 验 测 试 的 范围 ; 对 于 任何 有 意义 的 理论 分 析 而 言 这些 计算 机 都 
“过 于 量子 化 了 ”。 然 而 ,我 们 能 够 了 解 的 是 量子 计算 机 的 真实 计算 性 能 依赖 于 它们 成 功 运行 
量子 算法 的 能 力 。 这 些 充 分 利用 了 量子 并 行 性 的 算法 无 法 在 传统 计算 机 上 运行 ， 但 却 可 以 在 量 
子 计算 机 上 获得 非 同一 般 的 性 能 提升 。 

这 类 算法 的 一 个 例子 是 用 于 计算 大 数 质 因 子 的 Shor 算法 ， 这 种 算法 可 用 于 密码 学 和 编码 
学 。Peter Shor 在 贝尔 实验 室 发 明了 一 种 利用 量子 并 行 性 进行 大 数 质 因子 分 解 的 算法 ， 而 大 数 
质 因 子 分 解 是 当今 最 主流 的 公 钥 密码 算法 RSA 的 基础 。 对 于 RSA 而 言 这 是 一 个 不 幸 的 消息 ， 
因为 量子 计算 机 可 以 在 几 秒 内 破解 RSA 加 密 算法 ,使 得 当前 所 有 基于 RSA 的 加 密 软 件 全 部 失 
效 。 为 了 破译 密码 ， 程 序 员 只 需 简单 地 让 量子 计算 机 模拟 问题 集中 的 每 种 可 能 状态 ( 即 每 种 可 
能 的 密 钥 )， 从 而 最 终 得 到 正确 结果 。 除 了 在 量子 密码 学 上 的 应 用 ， 量子 计算 机 还 可 以 进行 超 
密度 通信 ， 以 及 改善 错误 检测 和 纠 错 。 

与 编程 关系 更 加 密切 的 一 个 量子 计算 应 用 是 产生 真 随机 数 的 能 力 。 传 统计 算 机 仅 能 够 生成 
伪 随 机 数 ， 因 为 随机 数 产 生 过 程 所 依赖 的 算法 总 是 存在 某 些 类 型 的 重复 模式 和 循环 。 在 量子 计 
算 机 中 ， 量 子 位 的 到 加 态 由 一 个 确定 概率 来 衡量 ( 即 每 种 状态 都 有 一 个 表示 其 概率 的 数值 系 
数 ) 。 在 我 们 的 例子 中 使 用 3 个 量子 位 ，8 个 数字 中 的 每 一 个 都 有 相同 的 概率 ， 从 而 得 到 一 个 
随机 数 产生 器 。 

这 些 量子 计算 机 在 我 们 之 前 所 讨论 的 复杂 问题 上 表现 很 好 的 原因 是 量子 计算 机 程序 员 可 以 
使 用 传统 物理 学 所 禁止 的 一 些 操作 。 在 这 些 机 器 上 进行 程序 设计 需要 完全 不 同 的 思维 方式 ， 它 
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们 没有 时 钟 和 取 指 - 译 码 -执行 周期 的 概念 。 此 外 ， 量 子 计 算 机 没有 真正 的 门 电路 ; 虽然 一 台 
量子 计算 机 可 以 通过 门 电路 模型 来 构建 ， 似乎 这 也 是 通常 采用 的 方法 ,但 这 样 很 难 制造 出 高 效 
的 机 器 。 量 子 计 算 机 的 设计 可 以 采用 很 多 种 体系 结构 。 很 有 意思 的 是 ， 与 摩尔 定律 类 似 ( 预测 
集成 电路 中 晶体 管 的 密度 ) ， 量 子 计 算 存 在 Rose 定律 (以 D- Wave 的 创始 人 和 首席 技术 官 Geo- 
ride Rose 命名 ) 。Rose 定律 是 每 12 个 月 可 以 成 功 地 将 用 于 计算 的 量子 位 位 数 将 翻 一 番 ， 在 过 去 
的 9 年 间 Rose 定律 都 是 正确 的 。 

在 量子 计算 机 成 为 通用 的 计算 机 之 前 还 有 很 多 的 难题 需要 解决 。 一 个 问题 是 量子 位 会 衰减 
为 单一 不 连贯 状态 的 趋势 ( 称 为 退 相关 ) ， 这 会 导致 信息 消失 和 不 可 避免 的 错误 结果 ; 最 近 在 
具有 纠 错 能 力 的 量子 编码 研究 中 科学 家 取得 了 显著 的 进展 。 也 许 对 于 量子 计算 发 展 最 大 的 限制 
因素 是 简单 地 进行 扩展 的 制造 方法 还 不 存在 。 这 个 问题 类 似 于 很 多 年 前 巴 贝 奇 曾 经 遇 到 过 的 问 
题 ， 我 们 可 以 看 到 : 我 们 只 是 没有 找到 构建 机 器 的 必要 方法 。 如 果 解 决 了 这 些 问题 ， 那 么 量子 
计算 机 将 替代 硅 ， 就 好 像 曾经 晶体 管 蔡 代 电 子 管 一 样 。 

量子 计算 的 实现 促使 很 多 人 想到 了 所 谓 的 技术 奇 点 ， 它 是 一 个 技术 时 间 点 ， 在 这 一 点 上 人 
类 技术 已 经 发 展 到 它 可 以 从 根本 上 并 且 不 可 道 地 改变 人 类 的 发 展 一 一 在 这 一 点 上 技术 已 经 发 展 
到 前 人 不 可 理解 的 程度 。 冯 : 诺 依 曼 最 先 创造 了 奇 点 一 词 ， 当 他 提 到 “科技 前 所 未 有 的 进展 以 
及 人 类 生活 模式 的 变革 看 起 来 好 像 达 到 了 人 类 历史 上 的 重要 奇 点 ， 超 越 这 一 点 的 人 类 事务 据 我 
们 所 知 将 无 法 继续 ”的 时 候 或 者 说 是 这 样 一 个 时 刻 “ 科 技 进步 变 得 不 可 理解 地 快速 与 复杂 ”。 
在 20 世纪 80 年代 早 期 ，Vernor Vinge( 一 个 计算 机 科学 教授 和 作家 ) 介绍 了 技术 奇 点 一 词 ， 并 
将 它 定 义 为 时 间 中 的 一 点 ， 在 这 一 点 我 们 创造 的 智能 优 于 我 们 人 类 本 身 的 智能 一 一 本 质 上 ， 这 
个 点 表示 机 器 替代 人 类 成 为 这 个 星球 统治 者 的 时 间 点 。Ray Kurzwell( 一 个 作家 和 奇 点 主义 者 ) 
将 技术 奇 点 定义 为 “未 来 技术 改变 的 步伐 十 分 迅速 ， 其 所 带 来 的 影响 十 分 深远 ， 以 至 于 人 类 生 
活 发 生 不 可 逆 改 变 的 时 期 。” James Martin( 一 个 计算 机 科学 家 和 作家 ) 将 奇 点 定义 为 “由 惊人 的 
技术 变革 引起 的 人 类 变革 时 期 。” Kevin Kelly(《 联 线 杂 志 ) 联 合 创 始 人 ) 将 奇 点 定义 为 当 “ 过 去 
几 百 万 年 发 生 的 改变 被 未 来 5 分 钟 发 生 的 改变 所 替代 的 ”时 刻 。 不 论 使 用 哪 种 定义 ， 很 多 人 相 
信 我 们 离奇 点 还 有 一 个 很 长 的 距离 ， 一 些 人 ( 像 D-Wave 公司 的 Geordie Rose ) 觉得 技术 变革 的 
时 刻 已 经 出 现 。 

量子 计算 是 一 个 具有 巨大 挑战 和 广阔 前 景 的 领域 。 这 一 领域 还 处 于 起 步 期 ， 但 是 它 比 人 们 
期 待 的 发 展 迅 速 。 很 多 资助 已 经 投入 到 量子 计算 领域 的 研究 中 ， 并 且 研 究 人 员 也 提出 了 许多 适 
合 在 量子 计算 机 上 运行 的 算法 。 我 们 期 竺 这些 系统 逐渐 成 熟 ， 并 成 为 真正 的 产品 ， 以 显著 改变 
我 们 所 熟知 的 计算 机 和 编程 方式 。 如 果 你 有 兴趣 接触 量子 计算 ， 你 可 以 联系 USC 实验 室 或 
Google 实验 室 申请 它们 量子 计算 机 的 机 时 。 


本 章 小 结 

本 章 对 多 处 理 器 和 多 计算 机 系统 进行 了 综述 。 这 些 系 统 提供 了 一 种 求解 复杂 问题 的 有 效 方式 。 

RISC 和 CISC 熟 优 熟 劣 的 争论 更 主要 表现 在 芯片 的 体系 结构 上 ， 而 不 是 ISA。 最 重要 的 还 是 程序 执行 
时 间 ， 并 且 RISC 和 CISC 的 设计 者 都 在 努力 提升 处 理 器 性 能 。 

Flynn 分 类 法 根据 指令 流 和 数据 流 的 数目 对 体系 结构 进行 分 类 。MIMD 计算 机 被 进一步 分 类 为 共享 存 
储 和 非 共享 存 储 。 

当今 计算 机 的 计算 能 力 令 人 十 分 震惊 。 处 理 器 内 部 的 并 行 性 通过 超标 量 和 超 流水 线 体系 结构 得 到 了 
提升 。 早 期 ， 处 理 器 每 次 完成 一 个 操作 ， 但 现在 的 处 理 器 通常 执行 多 个 并 发 操作 。 向 量 处 理 器 支持 向 量 
操作 ， 而 MIMD 计算 机 则 包含 了 多 个 处 理 器 。 

SIMD 和 MIMD 处 理 器 通过 互连网 络 进行 连接 。 共 享 存储 器 的 多 处 理 器 将 物理 存储 器 看 成 一 个 整体 ， 
而 分 布 式 存储 体系 结构 允许 每 个 处 理 器 访问 自己 的 存储 器 。 任 何方 法 都 允许 普通 用 户 以 一 个 合理 的 价格 
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拥有 超级 计算 能 力 。 最 流行 的 多 处 理 器 体系 结构 是 MIMD ， 共 享 存储 以 及 基于 总 线 的 系统 。 

一 些 高 复杂 度 的 问题 不 能 通过 传统 的 计算 模型 来 求解 。 针 对 特定 应 用 需要 一 些 其 他 的 体系 结构 。 数 
据 流 计算 机 通过 数据 驱动 计算 ， 而 不 是 计算 驱动 数据 。 神经 网 络 通过 学 习 可 以 求解 高 复杂 度 的 问题 。 肪 
动 阵列 利用 处 理 单元 的 计算 能 力 ， 驱 动 数据 在 阵列 中 传输 ， 直 到 获得 问题 的 求解 结果 。 不 同 于 上 述 基 于 
硅 工艺 的 计算 机 ， 生 物 、 光 和 量子 计算 机 非常 有 可 能 成 为 新 一 代 的 计算 技术 。 


扩展 阅读 


更 多 关于 当前 RISC 和 CISC 争论 的 信息 ， 参 考 Blem 等 人 (2013 ) 的 文章 。 

曾经 出 现 过 很 多 改善 Flynn 分 类 法 的 工作 。Hwang( 1987) 、Bell( 1989) 、Karp(1987) 以 及 Hockney 和 
Jesshope( 1988 ) 的 著作 在 不 同 程度 上 扩展 了 Flynn 分 类 法 

有 很 多 关于 高 级 体系 结构 的 教科 书 ， 包 括 Hennessy 和 Patterson (2006 ) 、Hwang(1993 ) 以 及 Stone 
(1993 ) 编写 的 书 。Stone 对 流水 线 和 存储 组 织 结构 进行 了 非常 详细 的 解释 ， 还 对 向 量 计 算 机 和 并 行 处 理 咒 
进行 了 叙述 。Grohoski 对 于 现代 RISC 处 理 器 中 的 超标 量 执行 给 出 了 详细 的 说 明 。 对 于 整个 RISC 理论 以 
及 指令 流水 线 的 解释 可 参见 Patterson( 1985 ) ，Patterson 和 Ditzel( 1980 ) 的 著作 。 

Hennessy(1984) 所 著 文章 是 一 篇 关于 VLSI 技术 和 处 理 器 设计 间 相 互 关系 的 优秀 文章 。Leighton 
(1982 ) 的 文章 虽然 有 些 过 时 ， 但 它 从 一 个 非常 好 的 视角 审视 了 体系 结构 和 算法 ， 是 一 篇 有 关 互 连 网 络 的 
参考 文章 。Omondi(1999 ) 所 著 书 籍 对 计算 机 微 体系 结构 给 出 了 权威 的 讲解 

对 于 数据 流体 系 结构 方面 优秀 的 论文 ， 以 及 各 种 数据 流 的 比较 ， 参 见 Dennis(1980) 、Hazra( 1982 ) 、 
Srini( 1986) 、Treleaven 等 (1982 ) 和 Vegdahl(1984 ) 所 著 书籍 。 

Foster 和 Kesselman(2003 ) ， 以 及 Anderson( 2004 ，2005 ) 所 著 书 籍 提供 了 关于 网 格 计 算 的 详细 信息 。 
有 关 BOINC 的 更 多 信息 请 详 见 http:Vboinc. berkeley. edu。 对 量子 计算 有 兴趣 的 读者 可 以 参阅 Brown 
(2000) 所 著 书 籍 ， 它 对 量子 计算 、 量 子 物理 学 和 纳米 技术 给 出 了 非常 不 错 的 介绍 。Williams 和 Clearwater 
(1998 ) 以 及 Johnson(2003 ) 的 文章 对 于 学 习 量子 计算 的 初学 者 是 个 很 好 的 选择 。 

作为 本 章 主题 的 补充 ， 参见 Stallings( 2009) 、Goodman 和 Miller( 1993 ) 、Patterson 和 Hennessy(2008 ) ， 
Tanenbaum( 2005 ) 所 著 书籍 。 有 关 互 连 网 络 方面 的 历史 展望 和 性 能 信息 ， 参 见 Byuyan 等 (1989) 、Reed 和 
Grunwald( 1987) ，Siegel( 1985 ) 所 著 书 籍 。Circello 等 (1995 ) 的 文章 中 有 使 用 摩托 罗拉 MC68060 芯片 的 一 
个 超标 量 体 系 结构 的 概述 。 

对 于 64 位 计算 机 体系 结构 的 决定 、 挑 战 以 及 折 中 设计 的 讨论 详 见 Horel 和 Lauterback(1999 ) 所 著 书 
籍 ; IA -64 体系 结构 和 其 指令 级 并 行 性 的 使 用 ， 在 Dulong( 1998 ) 的 书 中 有 很 好 的 解释 。Kogge(1981 ) 的 
书 对 流水 线 计算 机 进行 了 彻底 的 讨论 ， 并 最 先 对 流水 线 进行 了 形式 化 论述 。Trew 和 Wilson(1991 ) 所 著 书 
籍 对 并 行 计算 机 进行 了 很 有 意思 的 调查 ， 同 时 也 讨论 了 各 种 形式 的 并 行 性 。Sile 等 (1999 ) 的 书 提供 了 一 
份 调查 ， 这 份 调查 是 有 关 各 种 用 于 开发 微 处 理 器 并 行 性 的 体系 结构 方法 和 实现 技术 的 。 
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复习 题 


. 为 什么 会 提出 RISC 体系 结构 的 概念 ? 
. 相 比 CISC， 为 什么 RISC 对 流水 线 更 简单 ? 
。 请 描述 寄存 器 窗口 如 何 使 过 程 调用 更 加 有 效 。 


Flynn 分 类 法 基于 两 种 属性 对 计算 机 体系 结构 进行 分 类 ， 它 们 是 什么 ? 


。MPP 和 SMP 处 理 器 的 不 同 点 是 什么 ? 
. 我 们 提出 为 Flynn 分 类 法 增加 一 个 层次 。 在 这 个 更 高 层次 上 计算 机 的 显著 特征 是 什么 ? 


是 否 所 有 的 编程 问题 都 可 以 并 行 执行 ?限制 并 行 的 因素 是 什么 ? 
对 超 流 水 线 进行 定义 。 
超标 量 设 计 和 超 流水 线 设计 有 什么 不 同 ? 


.VLIW 设计 在 哪些 方面 不 同 于 超 流水 线 设计 ? 
.EPIC 和 VLIW 的 异同 点 是 什么 ? 


请 解释 寄存 器 - 寄存 器 向 量 处 理 体系 结构 固有 的 局 限 性 。 
给 出 向 量 处 理 器 高 效率 的 两 个 原因 。 
画 出 6 个 主要 的 互连网 络 拓扑 结构 。 


. 共享 存储 器 结构 有 3 种 类 型 ， 它 们 是 什么 ? 


描述 一 种 在 本 章 中 介绍 的 缓存 一 致 性 协议 。 


. 描述 网 格 计算 和 适用 于 网 格 计算 的 应 用 。 


什么 是 SETI， 它 如 何 使 用 分 布 式 计算 模型 ? 


. 什么 是 普 适 计算 ? 


数据 流体 系 结构 和 “传统 ”体系 结构 的 区 别 是 什么 ? 


。 什 么 是 重 人 代码 ? 


什么 是 神经 网 络 的 基本 计算 单元 ? 


. 描述 神经 网 络 是 如 何 “学 习 ” 的 


脉动 阵列 是 通过 什么 比喻 而 得 名 的 ? 为 什么 这 个 比喻 相对 准确 ? 


. 什么 类 型 的 问题 适合 通过 脉动 阵列 进行 求解 ? 


量子 计算 机 和 传统 计算 机 的 不 同 点 是 什么 ? 在 量子 计算 中 必须 克服 的 问题 是 什么 ? 





习题 
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为 什么 RISC 设备 的 操作 都 是 在 寄存 器 上 完成 ? 

RISC 系统 中 的 哪些 特征 可 以 直接 在 CISC 系统 中 实现 ? RISC 系统 中 的 哪些 特征 不 可 以 直接 在 CISC 系统 
中 实现 ? (参照 表 9-1 列举 的 两 种 体系 结构 的 特征 。) 

在 精简 指令 集 计 算 机 中 “精简 ”的 真正 含义 是 什么 ? 

假设 一 个 RISC 设备 使 用 如 下 的 重 和 到 寄存 器 窗口 : 

e 10 个 全 局 寄存 器 

e 6 个 输入 参数 寄存 器 

e 10 个 局 部 寄存 器 

e 6 个 输出 参数 寄存 器 

每 个 重 释 寄 存 器 窗口 是 多 大 ? 

一 个 RISC 处 理 器 有 8 个 全 局 寄存 器 和 10 个 寄存 器 窗口 。 每 个 窗口 有 4 个 输入 寄存 器 、8 个 局 部 寄存 
器 ， 以 及 4 个 输出 寄存 器 。 在 这 个 处 理 器 内 部 总 共有 多 少 个 寄存 器 ? (提示 : 请 记 住 ， 由 于 寄存 器 窗 
口 具 有 循环 特性 ， 所 以 最 后 一 个 窗口 的 输出 寄存 器 和 第 一 个 窗口 的 输入 寄存 器 是 共享 的 。) 

一 个 RISC 处 理 器 总 共有 152 个 寄存 器 ， 其 中 12 个 被 指定 为 全 局 寄存 器 、10 个 寄存 器 窗口 ， 其 中 每 个 
包含 6 个 输入 寄存 器 和 6 个 输出 寄存 器 。 每 个 寄存 器 窗口 中 有 多 少 个 局 部 寄存 器 ? 


. 一 个 RISC 处 理 器 总 共有 186 个 寄存 器 ， 其 中 18 个 是 全 局 寄存 器 、12 个 寄存 器 窗口 ， 在 每 个 窗口 中 有 


10 个 局 部 寄存 器 。 每 个 寄存 器 窗口 有 多 少 输入 /输出 寄存 器 ? 


. 假设 RISC 处 理 器 使 用 重 倒 寄存 内 窗 口 在 两 个 过 程 间 传递 参数 。 人 处 理 器 有 298 个 寄存 器 。 每 个 寄存 器 


窗口 有 32 个 寄存 器 ， 其 中 有 10 个 全 局 寄存 器 和 10 个 局 部 寄存 器 。 回 答 下 列 问题 : 

a) 输入 参数 可 以 使 用 多 少 个 寄存 器 ? 

b) 输出 参数 可 以 使 用 多 少 个 寄存 器 ? 

c) 有 多 少 个 可 用 的 寄存 器 窗口 ? 

d) 在 每 次 过 程 调 用 时 ， 当 前 窗口 指针 (CWP) 会 增加 多 少 ? 

回忆 第 8 章 中 有 关上 下 文 切换 的 讨论 。 它 发 生 在 一 个 进程 停止 使 用 CPU ， 而 另 一 个 进程 开始 使 用 CPU 
时 。 从 这 个 意义 上 说 ， 寄 存 器 窗口 可 以 看 成 RISC 潜在 的 弱点 。 请 解释 原因 。 


10. 假设 一 个 RISC 设备 使 用 5 个 寄存 右 窗 口 。 
a) 在 寄存 器 必须 保存 在 存储 器 之 前 ， 过 程 调用 的 深度 是 多 少 ”( 也 就 是 说 ， 在 我 们 需要 将 寄存 器 保 
存 到 存储 器 之 前 , “活跃 ”的 过 程 调 用 的 最 大 的 数目 是 多 少 ?) 
b) 假设 到 达 a 中 的 最 大 值 后 ， 有 多 于 两 个 过 程 调用 。 这 将 有 和 多少 个 寄存 器 窗口 必须 保存 在 存储 器 中 ? 
c) 现在 假设 最 近 被 调用 过 程 已 返回 。 请 解释 将 发 生 什么 ? 
d) 现在 假设 有 多 个 过 程 被 调用 。 这 时 总 共有 多 少 个 寄存 器 窗口 需要 被 保存 在 存储 器 中 ? 
11. 在 Flynn 分 类 法 中 : 


* a) SIMD 代表 什么 ? 请 给 出 简单 描述 和 一 个 实例 。 


b) MIMD 代表 什么 ? 请 给 出 简单 描述 和 一 个 实例 。 


.Flynn 分 类 法 包含 4 种 主要 的 计算 模型 。 简 要 描述 每 种 类 别 ， 并 给 出 使 用 每 种 模型 来 求解 的 一 个 高 层 


次 的 实例 问题 。 


. 请 解释 松 耦 合 和 紧 耦 合体 系 结构 的 不 同 。 

. 请 描述 MIMD 多 处 理 器 相对 于 多 计算 机 系统 或 计算 机 网 络 的 不 同 特征 。 

. SIMD 和 MIMD 的 相似 点 是 什么 y 不同 点 是 什么 ?注意 : 你 不 能 对 它们 进行 定义 ， 但 可 以 进行 比较 。 
.SIMD 和 SPMD 的 不 同 点 是 什么 ? 

. SIMD 最 适合 用 于 哪 种 类 型 的 程序 级 并 行 (数据 或 控制 )?MIMD 更 适合 用 于 哪 种 类 型 的 程序 级 并 行 ? 
. 对 VLIW 和 超标 量 模型 在 指令 级 并 行 性 上 的 特点 进行 简要 描述 和 比较 。 

. 在 VLIW 和 超标 量 中 哪 种 模型 对 编译 器 设计 有 更 大 的 挑战 ?为 什么 ? 
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32. 
33. 


34. 


对 超标 量 体 系 结构 和 VLIW 体系 结构 进行 比较 。 
为 什么 需要 分 布 式 系统 ? 


。UMA 和 NUMA 的 不 同 点 是 什么 ? 
. 在 互联 网 中 使 用 交叉 开关 的 主要 问题 是 什么 ”在 互联 网 中 总 线 的 问题 是 什么 ? 
. 考虑 如 下 Omega 网 络 ， 支 持 8 个 CPU( PO0 ~ P7) 和 8 个 存储 器 模块 (MO ~ M7 ) : 


处 理 器 第 一 级 ”第 二 级 第 三 级 ”存储 器 模块 





a) 说 明 下 列 连接 是 如 何 通过 网 络 实现 的 (解释 每 个 开关 是 如 何 设置 的 )。 交 叉 开关 命名 方式 为 1 A、2B 等 。 
i) PO— M2 i) P4—>M4 ii) P6 一 M3 

b) 这 些 连 接 能 够 同时 出 现 吗 ， 还 是 会 发 生 冲 突 ? 请 解释 原因 

c) 请 列举 一 个 在 a 中 没 出 现 ， 并 且 和 P0 一 M2 相 冲 突 的 处 理 器 对 存储 器 的 访问 。 

d) 请 列举 一 个 在 a 中 没 出 现 ， 并 且 和 P0 一 M2 不 冲突 的 处 理 器 对 存储 器 的 访问 。 


. 请 描述 当 写 直通 和 写 回 缓存 用 于 共享 存储 系统 后 需要 做 出 的 调整 ， 以 及 两 种 方法 的 优势 和 劣势 。 
. 数据 流 系 统 的 存储 器 是 基于 地 址 的 还 是 基于 相关 性 的 ? 请 解释 原因 。 

. 神经 网 络 是 串 行 处 理 信 息 吗 ? 请 解释 原因 

.请 对 监督 学 习 和 无 监督 学 习 的 神经 网 络 进行 比较 。 

. 请 从 数学 的 视角 对 神经 网 络 中 的 监督 学 习 进 行 描述 。 

.下面 两 个 问题 涉及 神经 网 络 的 单 感知 器 。 


a) 逻辑 NOT 相对 AND 或 OR 更 复杂 些 ， 但 仍 可 以 完成 。 在 这 个 例子 中 ， 仅 有 一 个 布尔 型 输入 。 为 了 
识别 逻辑 NOT 操作 符 ， 这 个 感知 器 的 权重 和 国 值 应 是 多 少 ? 
b) 请 说 明 为 什么 使 用 单 感知 器 是 不 可 能 实现 两 个 输入 x, 和 x, 的 XOR 操作 的 。 


. 当 脉 动 阵列 是 一 维 时 ， 请 解释 SIMD 和 脉动 阵列 的 不 同 点 。 


使 用 Flynn 分 类 法 ， 脉 动 阵列 可 归 为 哪 一 类 ?工作 站 集群 可 归 为 哪 一 类 ? 

请 在 下 面 空 白 处 填 人 C( CISC) 或 R(RISC) 来 表示 相应 的 技术 可 用 于 CISC 中 ， 还 是 可 应 用 于 RISC 中 。 
1. 简单 指令 ,平均 每 个 时 钟 周期 执行 一 条 指令 。 

. 单一 寄存 器 集 。 

. 复杂 的 编译 器 设计 。 

. 高 度 流 水 线 。 

. 任何 指令 都 可 以 访问 存储 器 。 

. 指令 通过 微 程 序 进行 解释 。 

. 固定 长 度 ， 译 码 简 单 的 指令 格式 。 

. 高 度 定制 ， 不 频繁 使 用 的 指令 。 

. 使 用 重 琶 寄存 器 窗口 。 
10. 相对 少 的 寻 址 方式 。 

研究 量子 计算 ， 并 根据 最 近 的 一 篇 文章 给 出 结论 。 
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谋 入 式 系统 专题 





10.1 引言 


Greg Papadopoulos 是 众多 相信 嵌 和 人 式 处 理 器 将 成 为 计算 机 硬件 中 下 一 个 重大 突破 的 人 之 
-。 通 用 微 处 理 器 的 拥护 者 认为 这 一 言论 即使 不 是 完全 具有 煽动 性 的 ， 也 是 具有 挑 鲜 意味 的 。 
然而 ， 可 以 很 容易 看 出 人 们 之 所 以 有 这 样 的 结论 是 因为 与 物理 世界 交互 的 每 个 实际 设备 都 由 某 
种 计算 机 控制 的 。 在 日 常生 活 中 ,我 们 会 遇 到 各 种 各 样 的 府 入 式 处 理 器 ， 而 对 于 通用 处 理 系 统 
我 们 可 能 只 会 用 到 一 两 种 。 

为 谋 入 式 系 统 给 出 一 个 准确 的 定义 是 很 难 的 。 从 某 种 意义 上 讲 ， 嵌入 式 系统 就 是 计算 机 系 
统 ， 由 CPU、 存 储 器 和 各 种 VO 接口 组 成 。 但 与 通用 计算 机 的 不 同 之 处 在 于 它们 仅 能 执行 大 型 
系统 中 一 组 有 限 的 任务 。 很 多 时 候 ， 大 型 系统 并 不 只 是 计算 机 。 骨 人 式 系统 既 可 以 出 现在 十 分 
简单 无 害 的 设备 中 (如 咖啡 机 和 网 球鞋 ) ， 也 可 以 出 现 十 分 复杂 的 设备 中 (如 商用 飞机 ) 。 当 前 
很 多 汽车 都 装备 了 许多 嵌 人 式 处 理 器 ， 每 一 个 处 理 器 负责 管理 一 个 特定 的 子 系统 。 这 些 子 系统 
包括 汽油 喷射 系统 、 排 放 控制 系统 、 防 抱 死 制 动 系统 、 巡 航 控制 系统 等 。 此 外 ,汽车 中 的 各 
种 处 理 器 彼此 进行 通信 ， 相 互 配 合 ， 从 而 使 汽车 处 于 合适 状态 。 例 如 ， 当 防 抱 死 制 动 系统 
启动 时 ， 巡 航 控制 系统 将 关闭 。 在 其 他 计算 机 中 也 会 出 现 庶 入 式 系统 。 磁 盘 控制 器 就 是 一 
种 位 于 计算 机 内 部 的 计算 机 。 磁 盘 控制 器 操纵 磁盘 臂 ， 并 在 读 写 磁 盘面 数据 时 ， 对 其 进行 
解码 和 编码 。 

我 们 需要 从 一 个 全 新 的 角度 去 考虑 能 入 式 系统 的 设计 与 编程 。 首 先 ， 可 以 看 到 在 散人 式 系 
统 中 软 硬 件 的 区 分 是 模糊 和 不 确定 的 。 在 通用 计算 中 ,我 们 在 运行 程序 之 前 就 已 经 知道 了 硬件 
的 计算 能 力 ， 但 在 嵌入 式 系统 设计 中 ， 这 就 不 一 定 了 。 硬 件 的 计算 能 力 会 随 着 系统 的 开发 而 产 
生变 化 。 此 时 ， 软 硬件 等 价 原则 将 成 为 最 根本 的 系统 设计 准则 。 软 硬件 的 功能 划分 将 成 为 最 主 
要 的 一 一 有 时 也 将 是 备 受 争议 的 一 一 设计 问题 。 

嵌入 式 系统 开发 与 通用 计算 的 第 二 个 不 同 点 在 于 对 和 骨 入 式 系统 进行 设计 时 必须 对 底层 硬件 
有 一 个 更 加 详尽 的 理解 。 采 用 高 级 语言 (如 Java 或 C ++ ) 进行 应 用 程序 开发 的 人 员 可 能 从 来 都 
不 清楚 或 不 关心 系统 存储 数据 的 字 节 序 ， 或 在 某 一 个 特定 的 时 间 是 否 发 生 了 中 断 。 然 而 ， 这 些 
底层 硬件 的 细节 对 于 藤 入 式 系统 的 程序 员 而 言 是 必须 要 清楚 的 。 

除了 上 述 问 题 以 外 ,嵌入 式 系统 设计 还 会 受到 很 多 功能 的 约束 。 这 些 约 束 包括 有 限 的 CPU 
处 理 速度 、 有 限 的 存储 容量 、 权 重 限制 、 有 限 的 功 耗 、 不 受 控 并 严 苛 的 操作 运行 环境 、 有 限 的 
物理 空间 以 及 对 骨 入 式 系统 硬 实时 性 的 高 要 求 。 此 外 ， 嵌 人 式 系统 的 设计 者 在 系统 设计 和 实现 
时 还 必须 时 刻 对 成 本 进行 严格 控制 ! 系统 升级 或 修复 漏洞 都 可 能 引起 功 耗 或 存储 容量 超出 设计 
约束 。 现 代 的 嵌入 式 系统 程序 员 与 20 世纪 50 年 代 时 他 们 的 父辈 在 主机 上 编程 一 样 ， 每 天 都 要 
花费 很 长 的 时 间 来 计算 机 器 周期 一 一 因为 每 个 机 器 周期 的 计算 都 是 有 价值 的 。 

在 上 述 设计 约束 中 ， 有 限 的 功 耗 通常 在 整个 设计 中 扮演 最 重要 的 角色 。 低 功 耗 意味 着 低热 
量 ， 这 意味 着 使 用 更 少 的 散热 片 一 一 进而 意味 着 更 少 的 硬件 成 本 或 更 小 的 体积 。 低 功 耗 同 时 也 
意味 着 可 以 提供 备用 电池 ， 从 而 提供 不 中 断 可 靠 的 操作 服务 。 

根据 对 功 耗 的 需求 ， 大 多 数 嵌 入 式 系 统 可 以 分 为 3 类 : 基于 电池 的 系统 、 固 定 电 源 系统 以 
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及 高 密度 系统 。 基 于 电池 的 系统 (如 便携 式 音频 设备 ) 需 要 最 长 的 电池 寿命 ， 最 小 的 设备 体积 。 
固定 电源 系统 (如 付费 电话 和 来 电 显示 ) 的 电量 供应 有 限 ( 如 通过 电话 线 供 电 ) ， 因 此 其 设计 目 
标 就 是 利用 有 限 的 电量 提供 最 大 化 的 性 能 。 考 虑 到 散热 的 问题 ， 高 密度 系统 (高 性 能 多 处 理 带 
系统 ) 由 于 考虑 到 散热 性 所 以 更 关注 能 效 。 例 如 ， 网 络 电话 ( VOIP) 系统 将 语音 信号 和 数据 集成 
在 一 起 ， 需 要 很 多 的 组 件 ， 势 必 产 生 大 量 的 热量 。 这 些 系统 采用 非 受 限 电源 供电 ， 但 必须 限制 
其 功 耗 ， 以 避免 系统 过 热 。 

第 四 点 ， 也 可 能 是 嵌入 式 系统 设计 最 困难 的 一 点 就 是 信号 的 时 序 。 骨 入 式 系统 设计 者 必须 
对 由 外 部 事件 产生 的 信号 和 艇 人 式 系统 本 身 产 生 的 信号 之 间 的 关系 有 一 个 精确 而 清晰 的 认识 。 
任何 事件 都 有 可 能 在 任何 时 间 以 任意 顺序 出 现 。 此 外 ,对 这 些 事件 的 响应 往往 应 在 儿 个 点 秒 
内 。 在 硬 实时 系统 中 ， 不 按时 响应 就 等 同 于 系统 失败 。 

嵌入 式 系统 必须 是 可 用 和 灵活 的 ， 同 时 也 必须 是 小 型 不 昂贵 的 (这 些 也 是 对 设计 和 制造 的 
要 求 ) 。 功 耗 也 是 必须 考虑 的 因素 。 我 们 将 在 后 续 章 节 展 开 讨 论 这 些 问 题 ， 首 先 ， 我 们 来 看 一 
下 授 入 式 人 硬件 。 


10.2 散 入 式 硬件 概述 

控制 飞机 迁 测 的 嵌入 式 处 理 器 与 咖啡 机 中 用 于 控制 咖啡 质量 的 戏 入 式 处 理 峰 有 着 本 质 的 不 
同 。 这 些 应 用 在 设计 复杂 度 和 时 序 模型 上 都 有 着 很 大 的 不 同 。 因 此 ， 它 们 需要 完全 不 同 的 硬件 
解决 方案 。 对 于 最 简单 的 控制 应 用 ， 标 准 的 成 品 微 控制 器 通常 是 很 合适 的 。 具 有 更 高 复杂 度 的 
应 用 对 艇 入 式 硬件 的 需要 可 能 超出 了 现 有 标准 模块 的 性 能 、 功 耗 或 成 本 。 这 时 ， 也 许 重 构 一 个 
电路 可 能 更 合适 。 对 于 高 度 定制 化 的 应 用 ， 或 者 对 于 响应 有 严格 要 求 的 应 用 ， 必 须 设 计 一 个 专 
用 芯片 。 因 此 ， 我 们 可 以 将 圣人 式 处 理 器 分 为 3 类: 标准 处 理 器 、 可 重 构 处 理 融 和 全 定制 处 理 
器 。 在 阐述 每 种 类 型 之 后 ， 我 们 将 考虑 如 何 选择 处 理 器 。 


10. 2. 1 标准 的 人 藤 入 式 系统 硬件 

台式 计算 机 、 笔 记 本 电脑 以 及 PDA 系统 对 于 能 耗 需 求 的 持续 增长 主要 来 源 于 超大 规模 集 
成 电路 技术 的 发 展 。 现 在 可 以 装 在 衬衣 口袋 中 的 计算 机 具有 过 去 百 万 美元 的 水 冷 主机 的 计算 性 
能 ， 并 且 这 种 计算 能 力 所 带 来 的 成 本 小 于 一 件 西装 。 尽 管 这 些 东 西 我 们 每 天 都 能 接触 到 ,但 由 
VLSI 技术 带 来 的 引 人 注 目的 应 用 从 根本 上 都 被 我 们 忽视 了 。 

微 控 制 器 

我 们 现在 经 常用 到 的 嵌入 式 处 理 器 都 源 自 于 过 去 十 分 先进 的 通用 处 理 器 。 虽 然 这 些 早 期 处 
理 器 的 计算 能 力 还 不 足以 运行 现在 常见 的 台式 计算 机 的 应 用 ， 但 对 于 简单 的 控制 应 用 是 足够 
的 。 此 外 ， 这 些 处 理 器 的 价格 相 比 之 前 也 大 幅 降低 ， 这 是 因为 相关 的 制造 商 已 经 在 个 人 计算 机 
得 以 广泛 应 用 时 收回 了 这 些 处 理 器 的 成 本 。 十 分 出 名 的 微 控制 器 摩托 罗拉 68HC12 是 从 第 一 代 
苹果 计算 机 的 核心 芯片 摩托 罗拉 6800 改进 而 来 的 。 摩 托 罗拉 已 经 售 出 了 数 十 亿 片 68HC12 及 以 
前 的 芯片 。 大 批量 的 生产 和 销售 ， 使 得 现在 购买 MC68HC12 时 ， 比 第 一 代 苹 果 用 户 买 一 根 打 印 
机 电缆 花 的 钱 还 要 少 。Intel 的 8051 是 从 8086 发 展 而 来 的 ， 而 8086 曾经 是 第 一 代 IBM PC 的 核 
心 处 理 器 。 

微 控 制 器 与 通用 处 理 器 有 很 多 相似 之 处 。 与 通用 处 理 器 类 似 ， 微 控制 器 是 可 编程 的 ， 而 且 
可 以 访问 各 种 外 设 。 与 通用 处 理 器 的 不 同 之 处 在 于 ， 微 控制 器 的 工作 主 频 更 低 ， 寻 址 空间 更 
小 ,并且 运行 在 其 上 的 软件 不 能 由 用 户 修改 。 

一 个 微 控 制 器 的 简单 示例 如 图 10-1 所 示 。 它 包括 一 个 CPU 核 、 用 于 存储 程序 和 数据 的 存 
储 器 、LO 端口 、LO 端口 控制 器 、 系 统 总 线 、 时 钟 和 看 门 狗 定 时 器 。 在 这 些 组 件 中 ， 看 门 狗 
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定时 句 是 唯一 一 个 在 之 前 章节 中 没有 讨论 过 的 模块 。 

顾名思义 ， 看 门 狗 定 时 器 会 留意 微 控 制 器 中 的 一 些 事件 。 当 检测 到 这 些 事件 时 ， 看 门 狗 提 
供 了 一 种 自动 防 故障 机 制 。 通 用 计算 机 不 需要 看 门 狗 定时 器 ， 因 为 它们 直接 和 人 进行 交互 。 如 
果 系 统 被 挂 起 或 崩溃 ， 操 作 人 员 通 常会 通过 重启 
来 恢复 系统 。 但 是 ， 人 们 不 可 能 对 周围 无 数 的 髓 
人 式 系 统 给 予 同 样 的 关注 。 此 外 ,和 入 式 系统 通 | : 
常安 装 在 我 们 无 法 触及 的 地 方 。 谁 可 以 按 下 外 太 | 微 处 理 器 核 
空 探 测 器 的 重启 键 ? 如 何 重 启 一 个 心脏 起 搏 器 ? 1 
我 们 是 否 花 了 太 长 时 间 才 意识 到 这 一 举动 的 必要 
从 概念 上 讲 ， 看 门 狗 定时 器 的 设计 和 操作 十 由 定时 器 
分 简单 。 定 时 器 通过 一 个 整数 值 进 行 初始 化 ， 然 | SRAM pe 
后 每 隐 几 毫秒 减 去 1。 运 行 在 微 控制 器 上 的 应 用 [vom 
程序 周期 性 触发 定时 器 中 断 程序 ， 使 其 计数 值 恢 
复 到 初始 值 。 每 当 定 时 器 计数 值 减 到 0 时 ， 看 门 
狗 电 路 将 发 出 一 个 系统 复位 信号 。 定 时 器 中 断 程 
序 是 对 运行 在 微 控制 器 上 的 应 用 程序 的 响应 。 这 
个 程序 可 能 具有 如 下 结构 : 











图 10-1 一 个 简单 的 微 控 制 器 


main() { 
boolean error = false; 
do while not (error) { 


resetWatchdog (); // 对 看 门 狗 定时 器 的 初始 值 进行 复位 
error = functionl() ; // 执行 第 一 段 用 户 函 数 
414f, (error) 
exit while; 
endif; 
resetWatchdog (); // 对 看 门 狗 定时 器 进行 复位 
error = function2(); // 执行 第 二 段 用 户 函 数 


if (error) 
exit while; 
endif; 
resetWatchdog(); 
error = function3(); // 执行 第 三 段 用 户 函 数 
区 
如 果 从 functionl ~ function3 中 的 任何 一 个 函数 ， 在 无 限 循环 中 被 挂 起 或 卡 住 ， 则 定 
时 器 的 计数 值 将 减 到 0。 这 样 ， 任 何 程序 (包括 任何 中 断 程序 ) 的 运行 时 间 都 不 会 长 于 看 门 狗 定 
时 需 的 计数 值 。 
目前 ， 有 上 百 种 不 同类 型 的 微 控 制 器 ， 其 中 有 一 些 是 专 为 特定 的 应 用 而 设计 的 。 一 些 特 别 
出 名 的 有 Intel 的 8051 、Microship PIC ( 可 编程 智能 计算 机 ) 系列 中 的 16F84A， 以 及 摩托 罗拉 
68000(68K) 系列 中 的 68HC12。 微 控制 器 可 以 拥有 模拟 接口 和 LO 缓存 ， 前 者 适用 于 非 离散 物 
理 控制 应 用 ， 后 者 适用 于 持续 大 容量 吞吐 应 用 。 微 控制 器 的 10 控制 可 以 采用 第 7 章 提 到 的 任 
何方 法 。 不 同 于 通用 系统 ， 编 程控 制 YO 对 于 栋 入 式 应 用 来 说 是 可 以 使 用 的 。 
微 控 制 器 可 以 小 到 4 位， 也 可 以 大 到 64 位 ， 存 储 容量 从 几 千 字 节 到 几 兆 字 节 。 为 了 使 电 
路 尽 可 能 地 小 和 快 ， 微 控制 器 的 指令 集体 系 结构 通 常 是 基于 栈 的 ， 并 且 可 针对 特定 领域 进行 优 
化 。 虽 然 采 用 “陈旧 技术 ”， 但 和 入 式微 控制 器 仍然 在 很 多 消费 类 产品 和 工业 机 器 中 得 到 了 广 
泛 应 用 。 可 以 确信 的 是 戏 和 式微 控制 器 仍然 会 沿用 很 多 年 。 
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看 门 狗 定时 器 的 工程 决策 


嵌入 式 系统 设计 者 一 直 都 在 争论 的 问题 是 ， 当 看 门 狗 定时 器 超时 后 应 该 马上 进行 复位 还 是 
应 该 调用 一 个 中 断 服务 程序 。 如 果 产 生 中 断 ， 则 一 些 有 价值 的 调试 信息 可 以 在 复位 前 捕获 到 。 
从 这 些 调 试 信息 中 ， 我 们 可 以 发 现 造成 定时 器 超时 的 根本 原因 ， 并 对 其 进行 分 析 和 更 正 。 如 果 
系统 只 是 简单 地 被 复位 ， 则 很 多 调试 信息 会 丢失 。 

二 六 和 一 一 个 崩溃 的 系统 很 有 可 能 无 法 可 靠 地 执行 任何 代码 ， 包 括 中 断 处 理 程序 。 因 
此 ， 中 断 服务 程序 也 可 能 无 法 产生 复位 。 这 种 不 可 恢复 的 错误 可 能 仅 由 简单 的 错误 栈 指 针 或 IO 
端口 上 的 一 个 错误 信号 就 能 引发 。 如 果 简 单 地 产生 一 个 复位 信号 ,我 们 可 以 确定 地 阻拦 一 个 灾 
难 性 的 硬件 错误 ， 也 就 是 说 ， 系 统 可 以 在 死机 后 的 几 个 毫秒 内 恢复 到 稳定 状态 。 

不 同 于 个 人 计算 机 的 重启 操作 ， poe tin dda E 花 费 更 少 的 时 间 。 实 际 上 ， 复 位 
的 速度 可 能 快 到 我 们 感觉 不 到 复位 已 经 发 生 了 。 这 从 一 个 方面 支持 了 之 前 的 论断 ， 即 中 断 方法 
优 于 复位 方法 。 但 我 们 还 有 另 一 种 硬件 解决 方案 : 谨慎 的 工程 师 可 以 将 一 个 锁 存 器 、 一 个 发 光 
二 极 管 (LED) 和 处 理 器 的 复位 端 连接 在 一 起 。 复 位 后 ，LED 被 点 亮 ， 这 表示 系统 出 现 了 一 个 问 
题 。 假 设 LED 在 人 们 可 以 看 到 的 位 置 ， 则 复位 会 很 容易 注意 到 。 

当然 ， 可 以 将 上 面 两 种 方法 进行 组 合 。 我 们 可 以 在 引发 调试 中 断 前 将 定时 器 初始 化 为 一 
比较 小 的 值 ， 如 果 定 时 器 超时 ， 则 可 以 确定 系统 出 现 了 问题 ， 随后 后 江门 和 过 沁 痢 按 信 时 。 一 小 
人 出 满足 产品 “质量 ”要 求 的 公司 可 以 考虑 使 用 这 项 技术 。 

而 ， 对 于 力求 制造 出 “高 可 靠 性 ”产品 的 公司 则 需要 再 深入 地 考虑 一 下 。 看 门 狗 定时 
rp 如 果 在 一 个 芯片 内 部 出 现 了 灾难 性 的 硬件 错误 时 ， 
那么 将 发 生 什么 ? 如 果 系 统 时 钟 停止 了 又 会 怎么 样 ? 工程 师 将 通过 提供 一 个 带 有 备份 看 门口 定 
dt dd er en Te 
以 在 需要 的 时 候 节省 成 千 上 万 元 ， 甚 至 人 命 。 因 此 ， 现 在 问题 又 转移 到 对 于 备份 定时 器 超时 的 
处 理 是 直接 复位 还 是 触发 中 断 服务 程序 。 





片上 系统 

我 们 可 以 看 出 微 控制 器 是 小 型 化 的 计算 机 系统 。 它 们 包括 CPU、 存 储 器 、1/0 端口 。 然 
而 ， 它 们 不 能 称 为 片上 系统 。 片 上 系统 这 个 名 称 通常 预 留 给 更 为 复杂 的 设备 。 

片上 系统 ( SoC ) 与 微 控制 器 的 区 别 在 于 复杂 度 和 更 多 的 片上 资源 。 微 控制 器 通常 还 需要 其 
他 支持 电路 ， 如 信号 处 理 器 、 译 码 器 和 信号 转换 器 等 。 片 上 系统 是 一 个 包含 所 有 功能 的 单独 的 
硅 片 ， 甚 至 可 以 装配 多 个 处 理 器 。 这 些 松 耦 合 的 处 理 器 不 需要 共享 同一 个 时 钟 或 存储 空间 。 独 
特 的 处 理 器 功能 在 一 定 程度 上 可 以 定制 ， 这 些 功能 由 专门 为 了 在 特定 领域 中 有 效 编程 而 设计 的 
ISA 提供 。 例 如 ， 因 特 网 路 由 器 内 可 能 有 几 个 用 于 处 理 通信 业务 的 RISC 处 理 器 ， 一 个 用 于 配 
羞 和 管理 路 由 器 的 CISC 处 理 器 。 微 控制 器 的 存储 器 通常 是 几 千 字 节 ，SoC 的 存储 器 通常 是 几 
兆 字 节 。 由 于 具有 更 大 的 存储 器 ， 因 此 SoC 可 以 运行 功能 完备 的 实时 操作 系统 (我 们 将 在 
10. 3.2 节 进 行 讨论 ) 。SoC 的 优势 在 于 速度 更 快 、 体 积 更 小 、 更 加 可 靠 并 且 功 耗 更 低 。 

虽然 有 很 多 标准 的 So 可 用 ， 但 有 时 仍然 需要 根据 特定 应 用 进行 定制 。 与 其 承受 完全 定制 
SoC 所 带 来 的 成 本 ， 还 不 如 通过 集成 各 公司 授权 的 知识 产权 (下 ) 电路 构成 半 定制 电路 。 授 权 的 
IP 模块 和 定制 电路 集成 构成 电路 拖 模 。 随 后 完整 的 电路 掩 模 送 入 到 电路 制造 设备 中 以 蚀刻 在 硅 
片上 。 这 个 过 程 非常 昂贵 。 当 前 掩 模 成 本 基本 为 100 万 美元 。 因 此 ， 必 须 充分 考虑 这 种 方法 的 
成 本 因素 。 如 果 一 个 标准 的 SoC 可 提供 相同 的 功能 ， 但 性 能 略 差 ， 则 100 万 美元 的 成 本 就 不 太 
划算 了 。 我 们 将 在 后 续 章 节 再 讨论 这 个 问题 


了 94 第 10 章 





10. 2. 2 可 重 构 硬 件 

由 于 一 些 应 用 过 于 特殊 和 专用 ， 因 此 很 难 有 一 款 现成 的 微 控制 器 能 够 运行 此 应 用 。 当 设计 者 
遇 到 这 样 的 问题 时 ， 他 们 通常 有 两 种 选择 : 设计 一 款 专 用 芯片 ， 或 采用 可 编程 逻辑 设备 ( PLD ) 。 
当 速 度 和 尺寸 不 是 主要 设计 因素 时 ，PLD 可 能 是 一 个 更 好 的 选择 。PLD 分 为 3 种 类 型 : 可 编程 
阵列 逻辑 、 可 编程 逻辑 阵列 以 及 现场 可 编程 逻辑 门 阵列 。 任 何 一 种 都 可 以 用 来 作为 黏合 逻辑 ， 
或 与 已 有 全 电 路 互 连 构 成 定制 电路 。 可 编程 逻辑 设备 通常 是 基于 我 们 在 第 3 章 中 提 到 的 组 合 
逻辑 电路 而 提出 的 。 我 们 现在 来 讨论 这 个 问题 有 助 于 理解 PLD 的 主要 功能 。 

可 编程 阵列 逻辑 

可 编程 阵列 逻辑 ( PAL) 芯片 是 第 一 代 可 配置 的 逻辑 设备 。PAL 由 一 个 可 编程 的 与 门 阵列 和 
一 个 固定 的 或 门 阵列 连接 的 输入 和 输出 而 构成 ， 如 图 10-2 所 示 。PAL 的 输出 是 输入 的 乘积 和 
电路 的 可 编程 性 通过 熔断 连接 与 门 和 输入 之 间 的 熔 丝 或 拨 动 两 者 之 间 的 双 搓 开关 来 实现 。 当 一 
个 PAL 的 熔 丝 熔断 后 ， 和 与 门 相 连 的 输入 变 成 了 逻辑 02。 或 门 则 收集 来 自 所 有 与 门 的 输出 以 
完成 最 终 的 计算 。 
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a) PAL 的 详细 逻辑 图 b ) 同样 PAL 的 简化 版 
图 10-2 可 编程 阵列 逻辑 (PAL) 


图 10-3 所 示 为 一 个 3 输入 、2 输出 的 PAL。 标 准 商 加 姜 如 
用 PAL 会 提供 若干 个 输入 和 几 十 个 输出 。 图 10-3 所 示 的 
电路 不 可 能 对 每 一 种 输入 函数 提供 输出 。 它 也 不 可 能 在 
一 个 输出 的 多 个 或 门 上 使 用 相同 的 乘积 项 ， 因 此 只 能 在 
多 个 输出 的 或 门 上 使 用 相同 乘积 项 。 

图 10-3 所 示 的 PAL 可 实现 xxzix4 + xix, 和 xixi%; 十 
xix, 两 个 功能 。 人 逻辑 设备 间 通 过 x 表示 连接 熔断 。( 有 
时 候 ， 我们 也 用 x 表示 连接 ， 也 就 是 熔 丝 没有 熔断 。) 如 
我 们 所 见 ， 最 小 项 *oxix， 被 重复 使 用 。 由 此 看 来 ， 如 果 
在 或 门 之 间 允 许 进行 任意 连接 ， 则 PAL 逻辑 门 的 使 用 
效率 会 更 高 。PAL 正 是 提供 这 种 额外 级 别 可 重 构 性 的 


设备 。 
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图 10-3 一 个 可 编程 的 PAL 





日” 有 两 类 PLD 熔 丝 。 第 一 类 需要 在 熔 丝 上 加 比 正 常 电压 更 高 的 电压 ， 以 使 熔 丝 烧毁 ， 从 而 断 开 连 接 。 第 二 类 
有 时 被 称 为 反 熔 丝 ， 因 为 它 的 初始 状态 是 断 开 的 。 当 反 熔 丝 被 烧毁 时 ， 两 条 导线 间 的 薄 绝 缘 层 会 熔化 ， 产 
生 导 电路 径 ， 因 此 形成 一 个 电路 。 这 与 我 们 通常 认识 的 熔 丝 行为 相反 。 在 本 章 的 讨论 中 ,我 们 指 的 是 第 一 
类 ， 所 以 烧毁 熔 丝 意味 着 切断 连接 。 
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可 编程 逻辑 阵列 

可 以 看 出 每 个 PAL 的 输出 总 是 阵列 中 由 与 门 表示 的 乘积 项 的 逻辑 和 。 在 前 面 的 说 明 中 ， 
每 个 输出 包含 两 个 最 小 项 ， 无 论 我 们 是 否 需 要 。PLA 通过 为 或 门 和 与 门 都 提供 熔 丝 或 开关 而 去 
除了 这 种 限制 ， 如 图 10-4 所 示 。 熔 断 熔 丝 或 打开 开关 则 表示 与 门 和 或 门 的 输入 为 逻辑 0。 


bs 功 bb Xo Xl xX 





ee XM MN 
a ) 一 个 可 编程 逻辑 阵列 b ) 一 个 复 用 最 小 项 的 PLA 
图 10-4 


PLA 比 PAL 更 加 灵活 ,但 它 的 速度 比 PAL 慢 ， 而 且 成 本 更 高 。 因 此 ， 当 速度 和 成 本 是 重 
要 的 因素 时 ，PAL 最 小 项 之 间 的 宛 余 性 是 可 以 忽略 的 。 为 了 最 大 化 功能 性 及 灵活 性 ，PLA 和 
PAL 芯片 通常 在 一 个 硅 片上 集成 几 个 阵列 。 这 两 种 设备 也 称 为 复杂 可 编程 逻辑 设备 (CPLD ) 。 

现场 可 编程 逻辑 门 阵列 

第 三 种 PLD 是 可 编程 逻辑 门 阵列 (FPGA) ， 它 用 查找 表 替 代 改 变 芯 片 内 的 接线 来 实现 可 编 
程 逻 辑 。 

图 10-5 给 出 了 一 个 典型 的 FPGA 逻辑 组 件 ， 它 由 存储 单元 和 多 路 复 用 器 构成 。 多 路 复 用 器 
(MUX) 根 据 逻 辑 输 入 x 和 Yy 的 值 选择 相应 多 路 复 用 器 的 输入 。 这 些 输入 信和 号 触发 多 路 复 用 天 选 
择 合适 的 存储 单元 ， 在 图 中 用 “?” 表 示 。 存 储 单元 中 的 值 构 成 多 路 复 用 器 的 输出 。 





图 10-5 一 个 现场 可 编程 逻辑 门 阵列 单元 的 逻辑 框图 


考虑 一 个 简单 的 例子 ， 如 第 3 章 讲 过 的 异 或 XOR 功能 。 两 输入 XOR 的 真 值 表 如 图 10-6a 
左边 所 示 。 这 个 真 值 表 被 编程 进 FPGA 之 后 如 图 10-6a 右边 所 示 。 你 可 以 直接 看 出 真 值 表 中 的 
值 和 存储 单元 中 的 值 的 对 应 关系 。 例 如 ， 当 信号 y 为 高 (逻辑 1) 时 ， 每 对 存储 单元 中 较 低 值 的 
那 一 个 被 最 左 侧 的 多 路 复 用 器 对 选中 。 当 x 值 为 高 时 ， 选 中 来 自 较 低 y 值 的 多 路 复 用 器 ， 即 多 
辑 0 为 x 多 路 复 用 器 的 输出 。 这 与 真 值 表 一 致 : 1 XOR 1 =0。 图 10-6b 给 出 了 与 逻辑 的 FPGA 
实现 。 








图 10-6 一 个 现场 可 编程 逻辑 门 阵列 的 框图 


FPGA 逻辑 组 件 通 过 一 个 由 交叉 开关 和 多 路 复 用 器 连接 构成 的 路 由 结构 进行 互 连 。 一 种 典 
型 的 配置 结构 称 为 岛屿 架构 ， 如 图 10-7 所 示 。 每 个 多 路 复 用 器 连接 和 交叉 开关 块 通过 编程 可 
将 一 个 逻辑 组 件 的 输出 连接 到 另 一 个 的 输入 。 大 约 70% 的 芯片 面积 用 于 组 件 间 的 互 连 和 路 内 
结构 。 这 是 造成 FPGA 相对 较 慢 ， 而 且 成 本 较 高 的 原因 之 一 。 


fx 这 站 | 于 关 块 本 IN 让 全 下 
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图 10-7 一 个 “ 岛 式 ”FPGA 结构 
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为 了 降低 成 本 ,提高 速度 及 扩展 功能 ， 一些 FPGA 在 内 部 配置 了 微 处 理 器 核 。 这 样 ， 微 处 
理 嚣 和 FPGA 可 以 各 自 完成 其 擅长 的 工作 。 此 外 ， 编 程 过 程 能 够 被 迭代 。FPCA 电路 可 以 针对 
性 能 进行 不 断 的 改变 和 调整 。 

FPGA 可 针对 很 多 应 用 以 一 个 合理 的 性 价 比 提供 大 量 逻 辑 功能 。 因 为 FPCA 可 以 按 需 重复 
编程 多 次 ， 所 以 它 对 于 构建 定制 电路 的 原型 十 分 有 用 。 实 际 上 ，FPCA 甚至 可 以 自 编 程 ( 即 在 
FPGA 中 实现 对 FPCA 本 身 进 行 编程 的 功能 ) 。 因 此 ， 很 多 人 认为 基于 FPGA 的 系统 是 计算 机 的 
一 个 新 突破 ， 这 样 的 系统 可 以 根据 不 同 的 工作 负载 或 在 模块 出 错时 进行 动态 重 构 。FPGA 具有 
为 重要 的 艇 入 式 处 理 器 提供 高 更 高 可 靠 性 的 潜力 ， 这 些 处 理 器 运行 在 对 安全 性 有 极 高 要 求 的 环 
境 中 。 此 外 ，FPGA 可 以 完成 自修 复 。 


可 重 构 计算 机 


任何 人 都 会 注意 到 当前 在 我 们 的 世界 中 充 斤 着 各 种 电子 设备 。 一 个 装备 齐全 的 大 学 生 通 常 
会 配备 一 台 笔 记 本 电脑 、 一 部 手机 、 一 个 个 人 数字 助理 (PDA) 、 一 个 CD 播放 器 以 及 一 个 电子 
书 阅读 器 。 因 此 ， 一 个 人 应 该 如 何 处 理 如 此 多 的 随身 携带 的 电子 设备 ? 

服装 生产 厂商 可 以 通过 提供 带 有 足够 多 特制 口袋 的 衣服 或 背包 来 解决 这 一 问题 。 至 少 已 有 
服装 生产 商 开 始 研制 具有 内 置 个 人 区 域 网 络 的 服装 了 。 

对 于 电子 设备 过 剩 这 个 问题 的 “工程 解决 方案 ”是 制造 少量 的 设备 ， 但 每 个 设备 具有 更 
多 功能 。 最 大 的 挑战 在 于 如 何 克 服 便携 式 消 费 电 子 产 品 在 功 耗 和 成 本 上 的 限制 。 的 确 ， 一 台 笔 
记 本 电脑 可 以 做 任何 我 们 想 做 的 事情 ， 但 它 的 重量 会 更 重 ， 功 耗 更 高 。 因 此 ， 我 们 提出 了 可 重 
构 电 子 设 备 : 单个 价格 实惠 且 具 有 足够 电量 的 电子 设备 ， 它 可 以 是 手机 、PDA 、 摄 像 机 、 甚 至 
是 音乐 播放 器 。 

不 容 置 疑 的 是 这 种 想法 远 远 超出 了 当前 的 技术 能 力 。 当 前 的 可 重 构 设备 主要 由 FPGA 组 
成 。 目 前 的 FPGA 速度 太 慢 ， 功 耗 太 高 ， 并 且 价 格 太 昂 贵 ， 因 此 不 适合 广泛 应 用 于 电子 设备 
中 。 对 于 这 一 领域 的 研究 涉及 以 下 几 方 面 。 第 一 是 关注 FPCA 芯片 的 路 由 结构 。 对 于 特定 应 
用 ， 可 以 采用 不 同 的 拓扑 结构 以 实现 高 效 路 由 。 最 显而易见 的 是 线性 配置 优 于 移 位 器 ， 因 为 位 
移动 本 质 上 就 是 线性 操作 。 几 家 公司 正在 研究 一 种 三 维 结构 ， 这 种 拓扑 结构 将 控制 单元 放置 在 
雇 辑 单元 的 下 方 ， 这 使 得 整个 芯片 封装 更 紧密 ， 路 由 路 径 更 短 。 

另 一 个 有 关 拓 扑 的 问题 是 芯片 内 部 不 一 致 的 信号 响应 。 在 路 由 结构 中 ,传播 距离 长 的 信号 
比 距 离 短 的 信号 将 花费 更 长 的 时 间 到 达 目 的 节点 。 这 将 拖 慢 整个 芯片 的 速度 ， 因 为 无 法 提前 获 
知 一 个 操作 将 使 用 距离 近 的 逻辑 单元 还 是 距离 远 的 逻辑 单元 。 时 钟 频率 由 最 坏 的 情况 来 决定 。 
针对 FPGA 优化 的 电子 设计 语言 编译 器 将 有 助 于 处 理 这 一 问题 。 

逻辑 单元 存储 器 功 耗 是 FPGA 研究 领域 的 另 一 个 方向 。 这 种 存储 器 通常 是 SRAM， 它 是 易 
失 的 。 这 意味 着 FPCA 必须 在 每 次 上 电 时 重新 配置 ， 配 置信 息 存 储 在 ROM 或 闪存 中 。 当 前 各 
种 非 易 失 存 储 器 采用 普通 市 场 不 常用 的 材料 构成 。 如 果 这 些 新 兴 存 储 器 能 够 在 普通 市 场 上 有 良 
好 的 前 景 ， 那 么 大 规模 生产 势必 降低 它们 的 成 本 。 

也 可 以 制造 一 种 混合 的 FPGA 芯片 ， 它 包含 对 于 很 多 功能 部 件 都 通用 的 普通 电路 模块 (如 
加 法 器 或 移 位 器 ) 。 芯 片 的 其 余部 分 用 于 定制 逻辑 ， 这 些 逻 辑 可 根据 需要 启动 或 关闭 。 

简 言 之 ， 可 重 构 电路 可 用 于 一 些 特定 应 用 ， 如 手机 通信 协议 模块 。 带 有 灵活 的 可 重 构 模块 
的 手机 可 以 很 方便 地 在 采用 不 同 协 议 的 本 国 (或 国际 ) 手 机 网 络 中 使 用 。 虽 然 这 一 想法 会 让 消 
费 者 花 钱 ， 但 这 也 意味 着 更 少 的 废弃 手机 会 进入 固体 废物 填 埋 堆 中 ,改善 日 益 重 要 的 环境 
问题 。 





10. 2.3 定制 设计 的 能 入 式 硬 件 

为 了 使 产品 占据 最 大 的 市 场 份额 ， 幅 入 式 处 理 器 厂商 在 他 们 的 芯片 上 应 尽 可 能 地 实现 更 多 
的 功能 。 购 买 这 些 复杂 现成 处 理 器 的 最 大 问题 就 是 芯片 上 的 一 些 功能 是 没有 必要 的 。 这 些 无 用 
的 电路 不 仅 会 使 芯片 运行 速度 变 慢 ， 而 且 它 们 还 将 造成 额外 的 功 耗 。 对 于 一 些 有 严格 设计 约束 
的 应 用 ， 可 编程 逻辑 设备 也 是 不 适合 的 ， 因 为 它们 通常 运行 速度 缓慢 ， 而 且 功 耗 较 高 。 简 言 
之 ， 对 于 一 些 设计 要 求 ， 唯 一 可 行 的 方法 就 是 构建 全 定制 的 专用 集成 电路 (ASIC ) 。 

要 想 构建 全 定制 专用 集成 电路 需要 从 3 个 方面 考虑 : 从 行为 的 角度 来 说 ， 我 们 需要 准确 定 
义 芯 片 能 够 完成 哪些 工作 。 我 们 如 何 能 够 根据 输入 获得 想 要 的 输出 ”从 结构 的 角度 而 言 ， 我 们 
需要 决定 哪些 逻辑 模块 可 以 提供 想 要 的 行为 。 从 物理 实现 的 角度 来 说 ， 我 们 要 考虑 功能 模块 应 
该 如 何 放置 在 硅 片上 以 最 优 地 使 用 芯片 面积 ， 同 时 使 模块 之 间 的 连接 距离 最 短 。 

每 个 方面 都 是 一 个 独特 的 问题 ， 需 要 一 套 专门 的 工具 集 进 行 支持 。 这 3 个 方面 的 内 在 关系 
可 通过 Daniel Gajski 提出 的 逻辑 综合 立 型 图 进行 清晰 的 描述 ， 如 图 10-8 所 示 。 
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图 10-8 ”Gajski 的 逻辑 综合 Y 型 图 


在 Y 型 图 中 ,每 个 坐标 轴 都 被 标记 以 表示 芯片 设计 中 每 一 维 细 节 的 层次 。 例 如 ， 考 虑 一 个 
二 进 制 计数 器 。 在 最 高 行为 级 ( 即 算法 级 ) 上， 我 们 知道 计数 器 在 当前 值 的 基础 上 递增 ,， 产生 
新 值 。 在 下 一 级 ， 我 们 知道 为 了 实现 这 一 功能 ， 需 要 使 用 某 种 寄存 器 来 存储 计数 器 中 的 值 。 我 
们 可 以 通过 寄存 器 传输 语句 ( 如 ACe-AC +1) ， 来 表示 这 个 功能 。 

在 结构 方面 ， 我 们 需要 明确 应 使 用 多 大 的 寄存 器 。 寄 存 器 由 触发 器 和 门 电路 组 成 ， 它 们 巾 
晶体 管 构 成 。 为 了 在 硅 片 上 实现 计数 器 ， 要 充分 考虑 每 个 存储 单元 在 硅 片 上 的 位 置 以 及 与 其 他 
单元 的 连接 ， 从 而 充分 利用 硅 片 上 的 空间 。 

当 电 路 规模 很 小 时 ， 可 以 对 逻辑 器 件 采用 手工 综合 的 方法 。 现 代 的 ASCI 由 成 千 上 万 个 旭 
辑 门 和 几 百 万 个 晶体 管 构成 。 这 些 芯片 的 复杂 度 已 经 超出 了 人 们 的 理解 。 各 种 各 样 的 工具 和 设 
计 语 言 可 以 帮助 处 理 这 些 复杂 度 ， 但 门 电 路 规模 的 持续 增长 促使 我 们 要 在 一 个 更 高 的 抽象 层次 
上 进行 设计 。 其 中 一 种 工具 就 是 硬件 描述 语言 ( HDL) 。 硬 件 描述 语言 的 设计 者 可 以 在 算法 级 对 
电路 行为 进行 描述 。 相 比 在 门 级 和 连 线 级 考虑 电路 设计 ， 设 计 者 利用 HDL 可 以 使 用 类 似 于 第 
二 、 第 三 代 编 程 语 言 中 的 变量 和 控制 结构 。 此 外 ， 对 于 门 电路 和 连 线 ，HDL 源 代码 可 转化 为 一 
种 名 为 网 表 ( netlist) 的 描述 文件 ， 而 不 再 是 创建 一 个 二 进 制 代 码 流 。 网 表 最 终 会 输入 到 生成 硅 
片 布 局 的 软件 中 。 

HDL 已 经 出 现 几 十 年 了 。 其 最 早 是 由 芯片 制造 商 私 有 的 。 其 中 一 种 语言 Verilog， 是 由 
Gateway 设计 自动 化 公司 在 1983 年 提出 的 ， 并 在 20 世纪 末 成 为 两 种 最 领先 的 HDL 之 一 。 在 
1989 年 ，Cadence 设计 系统 公司 收购 了 Gatewary， 并 在 下 一 年 将 Verilog 向 公众 开放 。YVerilog 在 
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1995 年 成 为 IEEE 标准 ， 最 新 版 本 是 IEEE 1264 一 2001 。 

由 于 借鉴 了 人 C 语言 ， 因 此 Verilog 十 分 易学 。C 语言 常用 来 编写 租 入 式 软件 ， 所 以 工程 师 
在 软 人 硬件 设计 之 间 可 以 较 容 易 地 转变 。Verilog 可 生成 两 种 抽象 级 别 的 网 表 。 最 高 级 寄存 器 传输 
级 (RIL) 使 用 类 似 于 C 语言 的 结构 ， 并 将 变量 替换 为 寄存 器 和 信和 号。 在 需要 的 时 候 ，Verilog 也 
可 以 在 门 级 和 晶体 管 级 对 电路 进行 建 模 。 

第 二 种 流行 的 HDL 是 VHDL， 它 是 Very(high- speed integrate circuit) Hardware Design Lan- 
guage 的 缩写 。VHDL 是 美国 国防 部 高 级 研究 计划 局 (简称 DARPA)， 联合 Intermetrics 、IBM 和 
德州 仪器 多 家 公司 在 1983 年 推出 的 。 这 种 语言 在 1985 年 8 月 开放 ， 在 1987 年 成 为 IEEE 标准 。 
最 新 版 本 是 IEEE 1097 一 2002 。 

VHDL 的 语法 类 似 于 Ada 编程 语言 ， 是 唯一 授权 可 在 任何 国防 部 项 目 中 使 用 的 语言 。 相 比 
Verilog，VHDL 在 一 个 更 高 的 层次 上 对 电路 进行 建 模 。 类 似 Ada，VHDL 是 一 种 强 类 型 语言 ， 允 
许 用 户 自 定义 类 型 。 不 像 Verilog，VHDL 支持 并 发 过 程 调用 ， 它 是 多 处 理 器 设计 的 要 素 。 

随 着 电路 规模 的 日 益 增 加 ，VHDL 和 Verilog 已 经 很 难 跟 上 VLSI 的 发 展 了 。 采 用 这 些 语 言 
对 百 万 门 级 电路 进行 建 模 和 测试 是 一 项 极其 繁重 、 成 本 高 、 易 出 错 的 工作 。 很 明显 ， 芯 片 设 计 
的 抽象 层次 需要 再 一 次 提升 以 使 设计 者 关注 系统 、 功 能 ， 而 不 是 电路 、 信 号 和 连 线 。 为 了 适应 
这 一 需要 ， 相 继 提 出 了 几 种 系统 级 设计 语言 。 其 中 的 两 种 合并 成 为 : SystemC 和 SpecC。 

SystemC 是 对 C ++ 的 扩展 ， 包 含 了 用 于 建 模 伐 入 式 系统 中 时 序 、 事 件 、 反 应 式 行为 和 并 
发 性 的 类 与 库 。 它 由 几 家 EDA 公司 和 肯 入 式 软件 公司 共同 推出 。 其 中 最 重要 的 几 家 是 Synop- 
sys 、CoWare 以 及 Frontier Design。 在 工业 界 ， 它 们 实际 上 相互 提供 支持 。 一 个 包含 了 工业 界 和 
学 术 界 专家 的 组 织 Open SystemC Itiative， 负 责 维护 这 个 语言 的 改进 和 推广 。 

发 明 SystemC 的 主要 目的 是 想 设计 一 种 独立 于 具体 体系 结构 的 语言 ， 该 语言 可 在 电子 设计 
领域 被 广泛 使 用 和 支持 。 为 了 实现 这 一 目标 ， 任 何 同意 SystemC 协议 的 开发 者 都 可 以 下 载 源 代 
但 以 及 它 所 需要 的 类 和 库 。 任 何 兼 容 ANSI C ++ 的 编译 器 都 可 以 产生 可 执行 的 SystemcC 模块 。 

SystemC 在 两 个 抽象 层次 上 进行 建 模 。 在 最 高 层次 上 ， 仅 需要 描述 电路 的 功能 。 这 种 描述 
对 于 仿真 测试 套件 和 网 表 而 言 已 经 足够 了 。 如 果 需 要 更 细 的 建 模 粒度 ， 为 了 使 用 功能 性 的 或 
RTN 风格 ，SystemC 也 能 够 在 硬件 实现 级 产生 一 个 系统 或 模块 

SpecC 是 另 一 个 在 EDA 工业 界 引 起 关注 的 系统 级 设计 语言 。SpecC 最 初 是 由 加 州 大 学 欧 
文 分 校 的 Daniel Gajski、Jianwen Zhu、Rainer Dimer、Andreas Gerstlauer 和 Shuqing Zhao 开发 的 。 
它 现在 由 SpecC 开源 联盟 负责 维护 ， 这 个 联盟 由 来 自 工 业界 和 学 术 界 的 领导 者 组 成 。SpecC 编 
译 硕 和 相关 工具 及 文档 都 可 以 从 SpecC 官网 进行 下 载 。 

SpecC 相 比 SystemC 在 两 个 方面 有 着 本 质 的 不 同 。 首 先 ，SpecC 是 在 C 语言 的 基础 上 发 展 
起 来 的 ， 主 要 是 为 了 适应 艇 人 式 系统 设计 的 需要 。SpecC 的 设计 者 发 现 他 们 的 设计 目标 并 不 能 
简单 地 像 SystemC 那样 通过 增加 额外 的 库 来 实现 。 

第 二 点 也 是 最 显著 的 不 同 在 于 ，SpecC 在 它 的 包 中 包含 了 设计 方法 学 。 此 设计 方法 学 通过 
系统 设计 需要 考虑 的 4 个 方面 的 问题 来 引导 工程 师 进行 设计 ， 这 4 个 方面 分 别 是 说 明文 档 、 体 
系 结构 、 通 信 通 道 和 具体 实现 。 

确实 ， 使 用 任何 一 种 系统 级 描述 语言 都 与 传统 的 退 入 式 系 统 设计 方法 学 有 些许 的 不 同 。 传 
统 的 方法 如 图 10-9 所 示 。 其 流程 如 下 : 

e 在 柑 入 式 系统 安装 的 产品 中 ， 由 设计 者 清晰 描述 的 详细 的 说 明文 档 来 源 于 功能 描述 ， 基 

于 顾客 反馈 提高 的 产品 提升 可 在 此 阶段 由 市 场 部 提出 。 
e 基于 这 个 说 明文 档 和 销售 评估 ， 工 程 师 来 决定 是 选用 一 个 现成 的 处 理 器 ， 还 是 需要 定制 
一 个 处 理 器 。 





e 下 一 步 就 是 对 系统 进行 软 鲁 件 划 分 。 这 个 过 程 需要 考虑 是 否 有 合适 IP 的 可 用 ， 以 及 考 
虑 所 提出 的 处 理 器 对 于 面积 和 功 耗 的 要 求 。 
e 系统 对 软 硬 件 进行 划分 后 ， 就 可 以 开始 软件 和 硬件 设计 了 。 软 件 的 设计 过 程 取决 于 产品 
的 最 终 体 系 结构 。 在 基本 的 机 器 结构 设计 完成 后 ， 编 程 工作 才能 完成 。 

为 了 进行 软件 测试 ， 可 能 需要 设计 一 个 硬件 原型 系统 。 如 果 因 为 一 些 原因 不 能 构建 一 个 
原型 系统 ， 那 么 就 需要 对 完成 的 处 理 器 开发 一 个 软件 仿真 工具 。 集 成 测试 通常 需要 构建 
测试 向 量 ， 而 在 处 理 带 执行 程序 时 这 些 测试 向 量 包 含 其 每 个 引 脚 上 信号 的 二 进 制 状 态 。 
仿真 测试 将 消耗 很 长 的 时 间 ， 原 因 是 我 们 需要 使 用 测试 向 量 作为 输入 和 复杂 程序 的 输 
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每 个 人 都 满意 的 测试 完成 后 ,最终 的 设计 发 送 给 设备 进行 制造 ， 这 个 设备 生产 出 最 终 成 
品 微 处 理 需 。 
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图 10-9 传统 的 角 入 式 系 统 设计 周期 


总 而 言 之 ,这 就 是 传统 舱 入 式 系 统 的 工作 流程 。 然 而 ， 也 并 不 一 定 总 是 这 样 。 在 图 10-9 
中 的 两 个 反 向 箭头 用 于 标 出 当 设计 过 程 中 出 现 错误 后 的 两 条 路 径 。 因 为 软件 和 硬件 是 由 两 组 不 
同 的 人 员 开 发 的 ， 所 以 就 很 容易 忽略 某 个 关键 问题 ， 或 对 某 个 需求 两 个 团队 有 不 同 的 理解 。 实 
际 上 ， 对 需求 的 不 同 理解 可 能 贯穿 整个 设计 过 程 ， 这 就 可 能 造成 在 芯片 制造 完成 后 需要 重新 设 
计 。 最 坏 的 情况 是 一 个 设计 缺陷 在 处 理 器 放置 到 最 终 产 品 时 被 发 现 。 发 现 错误 越 晚 ， 就 意味 着 
越 高 的 修复 成 本 ， 这 包括 对 软件 或 硬件 (甚至 两 者 ) 的 重新 设计 ， 以 及 丧失 了 推 向 市 场 的 最 佳 
时 机 。 

现在 芯片 设计 的 复杂 度 远 远 高 于 Verilog 和 VHDL 出 现时 的 设计 。 传 统 的 嵌入 式 系统 设计 
模型 的 出 错 率 持 续 增 加 ， 并 且 无 法 满足 当前 产品 上 市 时 间 短 的 需要 。 由 于 处 理 器 设计 时 间 的 延 
长 造成 产品 上 市 时 间 的 延 后 ， 所 以 使 产品 的 竞争 力 大 大 下 降 。 为 了 使 带 有 处 理 器 的 产品 更 具 竞 
争 力 ,很 明显 必须 对 租 入 式 系统 设计 方法 进行 改变 。 系 统 级 设计 语言 (SystemC 和 SpecC ) 很 好 
地 适应 了 这 种 改变 。 这 些 语言 不 仅 提 升 了 设计 抽象 层次 ,也 消除 了 很 多 困扰 传统 嵌入 式 系统 开 
发 的 技术 壁垒 。 

在 传统 设计 流程 中 遇 到 的 第 一 个 问题 就 是 不 同 的 开发 团队 使 用 不 同 的 开发 语言 。 产 品 构思 
人 员 采 用 英语 描述 需求 。 根 据 需 求 ， 完 成 系统 级 设计 架构 。 然 后 根据 说 明文 档 ， 采 用 Verilog 
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或 VHDL 完成 硬件 设计 。 接 着 ， 将 硬件 设计 移交 给 软件 设计 者 ， 他 们 通过 C 、C ++ 或 汇编 完成 相 
应 的 工作 。 在 这 种 非 连接 过 程 中 多 次 迭代 可 能 导致 至 少 要 采用 两 种 不 同 的 语言 进行 重新 设计 。 
如 果 在 产品 设计 的 整个 过 程 中 采用 同样 的 设计 语言 和 同样 的 模型 将 大 大 简化 设计 工作 。 确 
实 ，SystemC 或 SpecC 最 大 的 好 处 就 是 它们 可 以 在 一 个 统一 的 高 层次 中 描述 系统 。 这 样 的 一 致 
性 允许 协同 开发 ， 就 是 软 硬 件 同时 开始 设计 。 产 品 的 设计 周期 会 显著 缩短 ， 同 时 提升 了 产品 的 
正确 率 。 
协同 设计 的 流程 如 图 10-10 所 示 。 正 如 我 们 所 看 到 的 ， 相 比 传统 流程 ， 它 的 步 又 更 少 : 
。 根据 详细 说 明文 档 中 提供 的 输入 、 输 出 以 及 其 他 对 约束 的 说 明 ， 采 用 SpecC 或 SystemC 
构建 一 个 系统 级 处 理 器 仿真 模型 。 这 是 系统 的 行为 模型 。 行 为 模型 可 验证 设计 者 对 处 理 
天 的 功能 理解 是 否 正 确 ， 也 可 对 整个 设计 的 行为 进行 验证 。 
。 在 系统 协同 设计 阶段 ， 接 下 来 就 是 软件 和 硬件 开发 过 程 的 分 解 以 便 并 行 执行 ， 以 及 对 系 
统 说 明 的 进一步 细 化 。 软 硬件 的 划分 要 考虑 很 多 因素 ， 包 括 空间 时 间 上 的 权衡 等 。 然 
而 ， 在 这 一 阶段 ， 硬 件 设 计 仅 通过 仿真 进行 模拟 ， 因 此 划分 需要 进行 动态 调整 ， 而 不 像 
传统 流程 中 根据 静态 硬件 原型 平台 确定 一 种 软 硬 件 划分 方案 。 
。 通过 每 一 步 的 细 化 ， 系 统 的 行为 模型 在 协同 验证 的 过 程 中 检查 仿真 后 的 处 理 器 。 由 于 硬 
件 设计 仅 是 最 终 产品 的 仿真 模型 ， 因 此 设计 的 修成 过 程 会 明显 加 速 。 此 外 ， 不 同 开发 团 
队 的 联系 更 加 紧密 ， 因 此 设计 和 迭代 的 次 数 也 显著 降低 。 
。 一 旦 开发 完成 软件 和 虚拟 硬件 模型 ， 它 们 就 可 以 使 用 一 个 虚拟 处 理 器 模型 开始 同时 测试 
了 。 这 个 过 程 称 为 协同 仿真 。 
。 在 软 硬 件 功 能 通过 最 初 的 行为 模型 验证 后 ， 一 个 可 综合 的 网 表 用 于 布局 布线 和 制造 。 
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图 10-10 舱 入 式 处 理 器 协同 开发 流程 


虽然 SystemC 和 SpecC 是 第 一 代 系统 级 设计 语言 ， 但 它们 绝 不 是 最 后 的 系统 级 设计 语言 。 
开发 人 员 正 在 努力 尝试 通过 Java 或 UML 实现 同样 的 系统 级 开发 。 支 持 工 具 的 供应 商 和 用 户 将 
最 终 决 定 那 种 语言 是 最 终 的 胜出 者 。 很 明显 ， 除 了 采用 VHDL 或 Verilog 进行 电路 设计 以 外 ， 
基于 系统 级 设计 语言 的 时 代 正 在 到 来 。 此 外 ， 如 果 采 用 某 种 标准 语言 ，IP 设计 将 变 得 更 加 便 
宜 。 当 选择 一 种 单一 的 设计 语言 后 ， 设 计 厂 商 的 设计 风险 将 会 降低 。 我 们 应 当 把 精力 更 多 地 放 
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在 设计 本 身 ， 而 不 是 将 设计 从 一 种 开发 语言 翻译 成 另 一 种 开发 语言 。 


谋 入 式 系统 的 折 中 设计 


由 于 定制 处 理 器 芯片 的 成 本 是 十 分 高 的 ， 因 此 只 有 当 市 面 上 的 处 理 器 无 法 满足 功能 、 功 耗 
或 速度 要 求 时 ,我 们 才 考 虑 全 定制 芯片 ， 否 则 一 定 会 选用 现成 的 处 理 器 。 

因为 谋 入 式 系 统 往往 作为 其 他 产品 中 容易 忽视 的 部 分 进行 出 售 ， 所 以 在 没有 进行 足够 的 市 
场 分 析 时 ， 很 难 决定 是 设计 一 个 褒 入 式 系统 还 是 购买 一 个 嵌入 式 系 统 。 这 个 决定 受 两 个 因素 的 
影响 : 市 场 对 产品 的 需求 ， 以 及 如 果 定 制 一 个 处 理 器 ， 需 要 多 长 时 间 才 能 将 产品 推 向 市 场 ? 

虽然 设计 和 制造 一 个 处 理 器 的 成 本 是 十 分 昂贵 的 ， 但 如 果 产 量 大 的 话 ， 定 制 处 理 器 也 是 一 
个 经 济 的 解决 方案 。 处 理 器 成 本 的 计算 公式 如 下 : 

整体 处 理 器 成 本 = 固定 成 本 + (单元 成 本 x 单元 个 数 ) 

固定 成 本 是 指 一 次 性 工程 费用 ( NRE)， 包括 处 理 器 的 设计 和 测试 费用 、 掩 模 费 用 ， 以 及 
产品 线 的 构建 费用 。 单 元 成 本 是 指 在 生产 线 建立 后 每 个 处 理 器 单元 的 制造 费用 。 

假设 我 们 目前 从 事 视频 游戏 产业 。 我 们 希望 在 6 月 推出 一 款 基于 电影 版 《 格 列 佛 游记 》 的 热 
卖 游戏 。( 人 们 通过 控制 小 人 国 居 民 的 滑 移动 作 进行 游戏 。) 市 场 部 的 工作 人 员 相 信和 如 果 能 够 及 
时 推出 ， 可 以 卖 出 50 000 套 游 戏 ,每 套 可 以 获得 12 美元 的 利润 。 基 于 之 前 的 经 验 ， 我 们 知道 
设计 这 样 一 款 游戏 的 NRE 是 750 000 美元 ,每 一 个 处 理 器 的 成 本 是 10 美元 。 因 此 ， 总 成 本 如 
下 所 示 : 





总 成 本 = 750 000 + (50000 x 10) = 1250 000 

另 一 种 方案 是 购置 一 款 比 定制 处 理 器 慢 ， 成 本 高 的 处 理 器 ， 如 果 这 种 处 理 器 的 价值 为 30 
美元 ， 则 总 成 本 如 下 所 示 : 
总 成 本 = 0 + (50 000 x30) = 1500000 

由 此 可 见 ， 定 制 处 理 器 的 方案 节省 了 250 000 美元 。 这 意味 着 顾客 可 以 用 较 低 价格 购买 游 
戏 ， 或 增加 企业 利润 ， 也 可 以 两 种 兼 有 。 

很 明显 ， 我 们 的 成 本 模型 是 基于 一 种 假设 的 ， 即 可 以 卖 出 50 000 套 游 戏 。 如 果 这 种 假设 成 
立 ， 则 很 容易 做 出 决定 。 然 而 ， 我 们 却 没 有 考虑 设计 一 款 全 新 处 理 器 所 需 花费 的 时 间 。 

假设 市 场 部 给 出 了 如 下 图 所 示 的 游戏 月 销售 情况 预测 。 基 于 电影 题材 游戏 上 的 经 验 ， 市 场 
部 工作 人 员 预 测 在 电影 放映 前 会 有 一 些 销售 量 。 随 着 电影 的 公映 ， 销 售 量 达 到 顶峰 ， 然 后 在 随 
后 的 6 个 月 销售 量 逐 渐 下 降 。 





15 000 


电影 在 6 月 15 日 放映 





5 6 7 8 9 10 11 12 
7000 9000 10000 8000 6500 4500 3000 2000 
月 度 游戏 销售 预测 
为 了 售 出 50 000 套 ， 游 戏 必须 在 5 月 1 日 前 上 架 。 如 果 设 计 和 生产 定制 处 理 器 造成 我 们 错 
过 5 月 这 个 发 行 期 3 个 月 以 上 ， 则 最 好 的 选择 就 是 使 用 一 款 现 成 的 处 理 器 ， 即 使 这 款 处 理 器 的 
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单位 成 本 更 高 ， 性 能 更 差 。 

上 面 的 例子 说 明 对 于 产品 上 市 时 间 的 折 中 考虑 对 于 利润 来 说 至 关 重 要 。 选 择 现成 处 理 器 或 
FPGA 的 为 一 个 原因 是 销售 数据 不 是 很 清楚 时 。 换 句 话说 ,在 市 场 需求 不 清楚 的 时 候 ， 选 择 一 
个 现成 的 处 理 器 相 比 引发 定制 处 理 器 的 NRE 成 本 可 以 最 小 化 初始 投资 。 如 果 产 品 热卖 ， 则 可 
以 在 后 续 “ 全 新 的 改进 版 ”产品 中 使 用 一 个 带 有 NRE 成 本 更 快速 的 定制 处 理 器 ， 这 样 可 能 会 
带 来 更 大 的 销量 。 


10.3 肯 入 式 软件 概述 

虚拟 存储 器 和 千 兆 赫 效 主 频 的 处 理 器 使 得 通用 程序 设计 人 员 不 需要 关心 运行 程序 的 硬件 。 
此 外 ， 当 这 些 程序 员 采 用 C 或 Java 编写 应 用 程序 时 ， 人 性 能 问题 通常 在 用 户 提出 后 才 去 解决 。 
有 时 性 能 问题 可 通过 调整 程序 代码 来 解决 ;， 有 时 性 能 问题 可 通过 为 运行 速度 慢 的 机 器 添加 新 的 
硬件 来 解决 。 骨 入 式 系统 程序 员 通 常 采用 汇编 语言 编写 程序 ， 并 且 不 能 在 事后 进行 性 能 优化 。 
性 能 问题 必须 在 用 户 使 用 之 前 就 找 出 来 ， 并 且 解 决 掉 。 算 法 和 运行 程序 的 硬件 具有 紧密 的 联 
系 。 简 言 之 ， 编 写 府 入 式 系统 程序 需要 我 们 对 代码 进行 思考 ， 并 且 能 够 深入 理解 计算 机 是 如 何 
运行 程序 的 。 


10. 3.1 藤 入 式 系统 的 存储 器 组 织 


嵌入 式 系统 的 存储 器 组 织 相 比 通 用 计算 机 在 本 质 上 有 两 点 不 同 。 首 先 ， 舱 入 式 系统 很 少 使 
用 虚拟 存储 器 。 其 原因 是 大 多 数 散 入 式 系统 对 时 间 有 严格 的 要 求 。 特 定 的 操作 必须 在 指定 的 时 
间 内 完成 。 考 虑 到 虚拟 存储 器 的 访问 时 间 可 能 会 在 儿 个 数量 级 之 间 变 化 ， 因 此 嵌入 式 系 统 的 时 
序 将 变 得 不 可 确定 ， 这 是 舱 入 式 系统 设计 无 法 接受 的 。 此 外 ， 虚 拟 存储 器 页 表 的 维护 将 花费 宝 
贵 的 存储 资源 和 机 器 周期 。 

第 二 个 原因 就 是 戏 入 式 系统 的 存储 器 组 织 是 多 样 化 的 。 与 通用 系统 程序 员 不 同 ， 伐 人 式 系 
统 程序 员 十 分 关心 存储 融 的 类 型 和 容量 。 一 个 艇 入 式 系统 可 能 包含 RAM、ROM 和 闪存 。 sen 
空间 不 一 定 总 是 连续 的 ， 因 此 某 些 访 存 地 址 可 能 是 非法 的 。 图 10-11 显示 了 一 个 执行 环境 ， 
包含 了 若干 预定 义 的 地 址 块 。 预 留 的 系统 存储 空 本 的 中 和 可 四 条 和 施 ( 
的 入 口 地 址 。 当 某 些 信 号 在 处 理 器 引 脚 上 出 现时 ， 中 断 服务 程序 被 调用 以 响应 这 些 信号 
序 员 不 能 控制 哪些 引 脚 连接 到 哪个 中 断 向 量 上 。) 


非法 
地 址 空间 





图 10-11 一 个 戏 入 式 系统 的 存储 空间 模型 


你 可 能 注意 到 我 们 的 存储 空间 划分 为 程序 存储 器 、 可 写 数据 存储 器 以 及 只 读 存储 器 。 只 
存储 器 用 于 存储 内 入 式 程序 所 使 用 的 常量 。 因 为 小 型 府 人 式 系统 通常 只 运行 一 个 程序 ， 所 以 常 
量 保存 在 ROM 中 ， 这 样 可 以 防止 意外 地 错误 覆盖 它们 。 在 许多 伐 入 式 系 统 中 ， 设 计 者 决定 程 
序 代码 放置 的 位 置 ， 如 放置 在 RAM、ROM 或 flash 存储 器 中 。 栈 和 堆 经 常 放置 在 静态 RAM 中 ， 
以 避免 引入 DRAM 的 刷新 周期 。 一 个 能 和 式 系 统 可 以 使 用 堆 ， 也 可 以 不 使 用 堆 。 一 些 程序 设计 
者 避免 使 用 动态 存储 空间 分 配 ， 其 原因 与 避免 使 用 虚拟 存储 器 一 样 ， 即 存储 器 清 零 将 引入 不 可 
预知 的 访问 延迟 。 更 为 重要 的 是 ， 应 当 定 期 执行 存储 器 清 零 ， 以 避免 堆 空 间 溢 出 。 髋 入 式 系统 
存储 空间 泄漏 是 十 分 严重 的 问题 ， 因 为 一 些 系统 可 能 使 用 了 几 个 月 ， 甚 至 是 几 年 都 不 会 重启 。 





如 果 没有 显 式 的 清 零 或 重启 ， 即 使 最 小 的 存储 空间 泄漏 都 有 可 能 消耗 掉 整 个 堆 空 间 ， 最 终 引 起 
灾难 性 的 系统 崩溃 。 


10. 3.2 ” 散 入 式 操作 系统 


简单 的 微 控制 器 往往 只 运行 一 个 中 低 复杂 度 的 应 用 。 这 样 ， 除 了 其 运行 的 程序 外 ， 微 控制 
右 不 需要 对 任务 或 资源 进行 管理 。 随 着 骨 入 式 硬件 性 能 的 持续 提升 ， 柚 入 式 应 用 变 得 越发 多 样 
化 ， 也 越 来 越 复 如 。 现 在 ,高 端的 舱 入 式 处 理 带 能 够 支持 多 并 发 程序 。 正 如 我 们 在 第 8 章 中 提 
到 的 ， 如 果 没 有 由 操作 系统 (但 不 是 所 有 操作 系统 ) 提 供 的 对 多 任务 和 资源 管理 的 支持 机 制 ， 
是 很 难 使 用 现在 的 强大 的 处 理 占 的 。 授 入 式 操 作 系 统 和 通用 操作 系统 在 两 个 方面 有 不 同 点 。 首 
先 ， 舱 入 式 操作 系统 是 允许 用 户 直 接 对 人 硬件 进行 访问 的 ， 而 通用 操作 系统 主要 是 避免 对 外 设 的 
访问 。 第 二 点 也 是 最 重要 的 一 点 ， 艇 人 式 操作 系统 对 事件 的 响应 性 需要 清晰 定义 和 理解 。 

入 式 操 作 系 统 不 一 定 是 实时 操作 系统 。 在 第 8 章 ， 我 们 提 到 有 两 种 类 型 的 实时 操作 系 
统 。“ 硬 ”实时 意味 着 系统 的 响应 必须 在 严格 定义 的 时 间 点 内 发 生 。“ 软 ”实时 对 时 间 的 要 求 
没有 这 么 严格 ,但 是 软 实 时 系统 也 要 在 明确 定义 的 时 间 范 围 内 对 所 处 环境 做 出 响应 。 

对 于 仅 依靠 人 类 与 其 交互 来 执行 某 些 功 能 的 嵌入 式 设备 ， 它 们 对 时 序 的 要 求 与 普通 台式 机 
相同 。 虽 然 反应 迟缓 的 手机 或 PDA 是 令 人 厌烦 的 ， 但 这 也 不 是 致命 问题 。 然 而 在 实时 系统 中 ， 
响应 性 是 决定 其 行为 正确 性 的 重要 因素 。 简 言 之 ， 如 果 一 个 实时 系统 的 响应 延 后 了 ， 则 系统 会 
表现 出 错误 。 

在 评价 实时 操作 系统 时 ， 有 两 个 重要 的 指标 : 上 下 文 切换 时 间 和 中 断 延 迟 。 中 断 延 迟 是 指 
从 产生 一 个 中 断 到 执行 中 断 服务 程序 的 第 一 条 指令 之 间 的 时 间 间 隔 。 

中 断 处 理 是 实时 系统 的 核心 。 程 序 员 必须 时 刻 留意 ， 因 为 在 任何 时 刻 都 可 能 会 产生 中 断 ， 
即使 是 其 他 关键 操作 正在 执行 的 时 候 。 因 此 ， 如 果 在 一 个 高 权限 的 中 断 发 生 时 ， 一 个 处 于 最 高 
权限 的 用 户 线程 正在 执行 ,那么 此 时 操作 系统 应 当做 什么 ? 一 些 操作 系统 会 继续 处 理 用 户 线 
程 ， 同 时 将 中 断 保存 在 队列 中 直到 用 户 线 程 处 理 完 毕 。 这 种 方法 可 能 会 出 现 问题 ， 也 可 能 不 
会 ， 这 取决 于 应 用 和 硬件 速度 。 

在 硬 实时 应 用 中 ， 系 统 必 须 快 速 地 对 外 部 事件 做 出 响应 。 应 此 ， 硬 实时 调度 器 必须 是 抢占 
式 的 。 最 好 的 实时 册 入 式 操作 系统 允许 在 一 个 很 宽 的 范围 内 为 任务 和 中 断 分 配 优先 级 。 然 而 ， 
优先 级 反 转 是 一 个 问题 。 当 一 个 高 优先 级 任务 需要 一 个 低 优先 级 任务 提供 服务 的 时 候 ， 或 当 一 
个 低 优先 级 任务 占据 了 高 优先 级 任务 需要 的 资源 的 时 候 ， 会 出 现 线程 优先 级 反 转 。 当 这 些 条 件 
中 的 任何 一 个 成 立时 ， 高 优先 级 任务 必须 停止 运行 ， 以 等 待 低 优先 级 任务 执行 完毕 。 和 否则 ， 系 
统 会 出 现 死 锁 。 一 些 散 入 式 操作 系统 通过 优先 级 继承 来 处 理 优先 级 反 转 问题 : 一 旦 出 现 优先 级 
反 转 ， 所 有 优先 级 都 置 为 同一 级 别 ， 使 得 所 有 竞争 的 任务 都 能 够 被 处 理 完 成 。 

第 二 种 类 型 的 优先 级 反 转 是 关于 中 断 的 。 在 中 断 处 理 过 程 中 可 以 将 中 断 关 闭 。 这 会 避免 出 
现 中 断 榜 套 的 情况 ， 即 中 断 服务 程序 的 执行 被 其 他 终端 所 打 断 ， 在 极端 情况 下 这 会 造成 栈 浇 
出 。 之 所 以 会 出 现 这 种 情况 是 因为 在 低 中 断 服务 程序 执行 时 ， 可 能 会 出 现 高 优先 级 中 断 。 当 关 
闭 中 断后 ， 高 优先 级 的 中 断 会 在 队列 中 等 待 ， 直 到 处 理 完成 低 优先 级 中 断 。 高 端 嵌 入 式 系统 则 
人 允许 中 断 巷 套 ， 并 会 识别 出 高 优先 级 中 断 的 出 现 ， 高 优先 级 中 断 将 抢占 低 优 先 级 中 断 的 执行 。 

除了 响应 性 ， 下 将 间 。 小 
型 、 高 效 的 操作 系统 内 核 意 味 着 占用 更 少 的 设备 存储 空间 。 这 给 出 我 们 一 个 成 本 模型 ， 它 可 以 
描述 操作 系统 授权 费用 和 存储 器 芯片 价格 的 关系 。 en ， 则 需要 考虑 使 用 一 个 小 
型 优化 的 操作 系统 。 如 果 存 储 器 价格 十 分 昂贵 ， 或 者 应 用 程序 需要 很 大 的 存储 空 | 间 ， 则 自己 设 
计 一 个 定制 的 操作 系统 更 加 合适 。 对 于 便宜 的 存储 器 ， 带 有 很 多 工具 的 大 型 操作 系统 可 能 是 一 
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个 更 好 的 选择 。 

插入 式 操作 系统 提供 商 可 将 系统 尽 可 能 地 模块 化 ， 以 在 功能 多 样 性 和 存储 空间 小 两 方面 获 
得 平衡 。 内 核 通 常 包含 一 个 调度 器 、 一 个 进程 间 通信 的 管理 器 、 简 单 的 IO 设备 ， 以 及 一 组 保 
护 机 制 ， 如 信号 量 。 所 有 其 他 的 操作 系统 特性 ， 如 文件 管理 、 网 络 支 持 ， 以 及 用 户 接口 都 是 可 
选 的 。 如 果 它 们 不 是 必需 的 ， 可 不 安装 它们 。 

操作 系统 遵循 标准 的 程度 也 是 进行 操作 系统 选择 时 需要 考虑 的 因素 。 一 个 最 为 重要 的 标准 
就 是 IEE 1003. 1 一 2001 可 移植 操作 系统 接口 和 POSIX( 发 音 是 paw-zicks) ， 这 是 一 个 标准 化 的 
UNIX 技术 规范 ， 并 且 现 在 已 包含 在 实时 性 的 扩展 中 。POSIX 实时 性 规范 包括 描述 定时 器 、 信 
号 、 共 享 存储 器 、 调 度 ， 以 及 互 斥 性 的 条 款 。 一 个 兼容 POSIX 的 实时 操作 系统 必须 通过 标准 中 
提 到 的 接口 来 实现 这 些 功 能 。 许 多 主要 的 乱入 式 操 作 系 统制 造 商 已 使 他 们 的 产品 通过 IEEE 认 
证 ， 以 便 使 这 些 系统 与 POSIX 是 兼容 的 。 这 个 认证 是 美国 政府 和 军 方 合同 中 必 备 的 。 

目前 有 许多 可 用 的 艇 入 式 操作 系统 。 其 中 主流 的 有 QNX、 授 入 式 Windows 8 以 及 徐 和 人 式 
Linux。QNX 是 历史 最 为 悠久 的 ， 其 大 小 小 于 10kb， 因 此 它 占用 存储 空间 的 最 小 。QNX 是 遵循 
POSIX 标准 的 系统 ， 并 且 有 可 选 安装 的 CUI、 文 件 系统 以 及 LO 系统 ,包括 PCI、SCSI、USB、 
串口 、 并 口 和 网 络 通信 。 过 去 20 多 年 中 ，QNX 基于 PowerPC 、MIPS 和 Intel 架构 已 经 用 于 科学 
和 医药 系统 。 

Linux 在 最 开始 就 是 兼容 POSIX 的 ， 但 如 果 不 进行 任何 修改 ， 它 是 不 适 于 硬 实时 系统 的 ， 
因为 它 没 有 抢占 式 调度 器 。2003 年 9 月 ，Linus Torvalds 和 Andrew Morton 发 布 了 Linux 内 核 的 
2.6 版 本 。 这 个 版 本 包括 了 一 个 更 高 效 的 抢占 式 调度 算法 。 一 些 内 核 进程 (如 “系统 调用 ”) 也 
能 够 被 抢占 。 虚 拟 存 储 器 是 一 个 可 选 的 安装 选项 。( 许 多 租 和 信 式 系 统 设计 者 不 会 安装 它 。) 在 这 
个 版 本 中 ， 仅 包含 基本 功能 的 内 核 所 需要 占用 的 存储 空间 为 230KB。 一 个 完整 安装 需要 500KB 
的 空间 。 几 乎 除 Linux 内 核 外 的 所 有 模块 都 是 可 安装 的 一 一 甚至 支持 键盘 ， 鼠 标 和 显示 器 。 藤 
人 式 Linux 支持 常见 的 主流 处 理 器 架构 ， 其 中 也 包括 几 种 流行 的 微 控 制 器 。 

微软 提供 了 几 种 戏 入 式 操作 系统 ， 每 种 分 别针 对 人 艇 人 式 系统 和 移动 设备 的 不 同类 别 。 与 过 
去 不 同 的 是 ， 现 在 Windows 众人 式 操作 系统 在 文 持 x86 处 理 器 的 同时 ， 也 提供 了 对 ARM 的 支 
持 。 增 加 对 ARM 的 支持 是 保持 微软 在 区 入 式 领 域 具有 疯 争 力 的 重要 一 步 。 微 软 对 区 入 式 领域 
的 巨大 投资 带 来 了 众多 的 产品 ， 并 且 都 已 推 向 市 场 。 产 品 包括 : 

e Windows Embedded 8 Standard， 它 是 Windows 8 的 模块 化 版 本 ， 设 计 者 可 以 根据 特定 
应 用 选择 相应 的 功能 。 这 些 可 选 功能 包括 网 络 、 多 媒体 支持 和 安全 。 

Windows Embedded 8 Pro， 它 是 Windows 8 的 完整 版 ， 只 是 调整 了 授权 模型 以 适应 组 
入 式 市 场 的 需要 。 

Windows Embedded 8 Industry， 它 是 根据 零售 业 、 金 融 服务 业 和 医疗 行业 的 需要 进行 
裁剪 的 Windows 8 版 本 ， 并 对 POS 机 、 品 牌 和 安全 提供 增强 化 的 支持 。 

Windows Phone 8， 它 是 Windows 8 的 精简 版 ， 保 留 了 Wiondws 对 于 移动 通信 平台 的 支 
持 功能 。 

Windows Embedded 8 Handheld， 它 是 Windows Phone 8 的 精简 版 ， 它 是 针对 工业 化 手 
持 设备 (如 扫描 仪 和 生产 控制 产品 ) 进行 裁剪 的 。 

Windows Embedded Compact 2013， 它 是 Windows 8 的 模块 化 版 本 ， 甚 至 比 Windows 8 
Compact 更 精简 。 整 个 操作 系统 通常 存放 在 ROM 中 。 

e Windows Embedded Automotive 7， 它 是 针对 汽车 应 用 特殊 定制 的 Windows 7 Compact。 

当 开发 应 用 不 太 受 资源 限制 时 ，Windows Embedded 8 系列 可 以 使 传统 软件 开发 人 员 容 易 地 
转 到 嵌入 式 领 域 。 程 序 开 发 人 员 所 熟悉 的 工具 (如 Visual Studio ) 不 需要 任何 调整 就 可 以 在 这 个 
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系列 中 使 用 。 因 此 ， 微 软 将 很 多 传统 应 用 移植 到 了 由 Android 和 iOS 占 统治 位 置 的 移动 环境 中 。 
理论 上 ， 基 于 Windows 的 谍 入 式 产 品 相 比 其 竞争 产品 能 更 快 地 推 向 市 场 ， 因 为 Windows 工具 使 
编程 更 加 容易 。 更 快 地 推 向 市 场 意味 着 现金 流 启动 得 更 快 。 这 又 意味 着 有 更 多 的 资金 可 用 于 购 
置 存 储 器 芯片 和 支付 操作 系统 的 授权 费 。 当 然 ， 成 本 的 计算 从 不 会 是 这 么 简单 的 。 

另 一 个 在 嵌入 式 系统 中 广泛 采用 的 操作 系统 是 MS-DOS。 虽 然 MS-DOS 从 没 提供 过 对 硬 实 
时 的 支持 ， 但 它 对 底层 硬件 的 访问 和 其 响应 性 对 于 很 多 应 用 来 说 是 足够 的 了 。 如 果 不 需 要 多 任 
务 ，MS-DOS 的 小 存储 容量 (大 约 为 64KB ) 和 便宜 的 授权 费 会 使 其 成 为 极 具 吸 引力 的 藤 入 式 操 
作 系 统 。 此 外 ， 因 为 MS-DOS 已 经 出 现 很 长 时 间 ， 所 以 工具 和 对 驱动 的 支持 都 是 现成 的 。 如 果 
即将 过 时 的 桌面 处 理 器 能 够 在 做 入 式 系 统 中 得 以 应 用 ,那么 这 也 会 将 操作 系统 带 入 能 人 式 
领域 。 


10. 3.3 肉 入 式 系统 的 软件 开发 

普通 应 用 程序 的 开发 是 一 个 高 度 交 互 的 过 程 。 一 些 成 功 的 设计 方法 学 引入 了 原型 概念 ， 在 
原型 中 会 设计 出 一 部 分 应 用 模型 的 功能 ， 然 后 交 给 系统 用 户 进行 审核 和 评价 。 然 后 ， 根 据 用 户 
输入 ， 调 整 原型 系统 并 再 次 提交 给 用 户 。 这 一 过 程 会 重复 多 次 。 这 个 方法 之 所 以 成 功 是 因为 它 
最 终 会 生成 一 组 清晰 的 功能 需求 ， 同 时 这 些 需 求 以 一 种 适合 软件 开发 的 方式 呈现 出 来 。 

虽然 交互 式 方法 非常 适合 普通 应 用 的 开发 ， 但 嵌入 式 系统 开发 还 需要 一 个 更 严格 和 更 直接 
的 方式 。 功 能 需求 在 软 硬 件 开 发 之 前 必须 表述 得 十 分 详细 。 为 了 做 到 这 一 点 ， 形 式 化 语言 对 于 
描述 系统 行为 来 说 是 十 分 有 用 的 ， 因 为 这 些 语 言 是 没有 歧义 且 可 测试 的 。 此 外 ， 对 于 普通 应 
用 ， 一 点 点 计划 上 的 “延迟 ”都 是 可 以 容忍 的 ， 但 必须 仔细 计划 嵌入 式 软件 的 开发 过 程 ， 并 
且 需 要 监控 开发 过 程 以 确保 和 硬件 开发 计划 同步 。 不 幸 的 是 ， 即 使 遵循 严格 的 开发 计划 ， 需 求 
也 可 能 被 忽略 ， 这 会 最 终 导致 系统 开发 失败 。 

为 复杂 应 用 开发 软件 时 ， 通 常 需要 将 工作 进行 划分 并 分 配给 不 同 团队 去 完成 。 如 果 没 有 这 
种 人 员 的 划分 ， 那么 想 在 最 后 期 限 之 前 完成 一 个 大 型 工程 几乎 是 不 可 能 的 。 假 设 系统 和 它 的 模 
块 已 被 分 析 ， 并 进行 了 详实 的 说 明 ， 那 么 将 它们 分 类 到 哪些 团队 是 很 容易 决定 的 。 

相反 ， 嵌 入 式 软件 很 难以 团队 为 单位 进行 划分 。 很 多 嵌入 式 程 序 在 系统 启动 后 就 马上 “ 跳 
转 到 main() 函数 ”。 然 后 ,程序 就 “永远 ”在 一 个 大 循环 中 轮 询 执 行 ， 直 到 外 部 事件 产生 相应 
的 信号 。 

在 符 入 式 程 序 员 中 长 期 以 来 都 有 争论 的 一 个 领域 就 是 全 局 变量 和 非 结 构 化 代码 的 使 用 。 正 
如 你 所 知 ， 全 局 变量 对 于 整个 程序 都 是 可 见 的 。 使 用 全 局 变量 的 风险 就 是 它 的 副作用 : 在 程序 
执行 的 过 程 中 ， 可 能 会 使 全 局 变量 的 取 值 没有 按照 程序 员 所 希望 的 方式 进行 更 新 。 实 际 上 ， 如 
果 想 任意 时 刻 都 能 确定 全 局 变量 的 取 值 是 不 可 能 的 。 

全 局 变量 的 优势 就 是 性 能 。 若 变量 的 可 见 性 被 限制 在 某 个 特定 函数 或 过 程 中 ， 在 每 次 函数 
调用 时 ， 都 需要 在 存储 空间 内 重新 创建 变量 。 这 一 过 程 在 通用 系统 中 会 带 来 额外 的 执行 延迟 ， 
也 就 是 局 部 变量 创建 带 来 的 开销 会 造成 很 大 的 性 能 问题 。 在 处 理 某 个 例 行 事件 时 ， 若 频繁 调用 
函数 会 使 这 一 问题 变 得 尤为 突出 。 

支持 使 用 全 局 变量 的 人 通常 也 是 能 够 容忍 在 谋 入 式 系统 中 使 用 非 结 构 化 (“spaghetti”) 代码 
的 人 。 结 构 化 程序 包含 一 个 调用 一 系列 函数 的 主线 ， 这 些 函 数 转 而 可 调用 更 多 的 函数 。 我 们 在 
10. 2. 1 节 中 讨论 过 的 微 控制 器 的 程序 片段 就 是 一 个 结构 化 程序 主线 。 在 非 结 构 化 代码 中 ， 即 
使 不 是 全 部 ， 但 至 少 大 多 数 代码 都 位 于 程序 的 主 循环 中 。 非 结构 代码 通过 分 支 ( goto ) 语句 控制 
程序 执行 ， 而 不 是 通过 调用 模块 来 执行 。 

非 结 构 化 代码 的 最 大 问题 就 是 它 很 难 进 行 维 护 。 特 别 是 当 程序 规模 庞大 ， 并 且 有 很 多 分 支 
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时 ， 这 个 问题 就 更 加 明显 了 。 非 结构 化 代码 很 容易 出 现 错误 ,特别 是 在 没有 好 用 的 方法 用 于 识 
别 任意 程序 块 的 执行 路 径 的 时 候 。 多 个 程序 人 口 和 退出 点 对 于 调试 器 而 言 简直 是 灾难 。 

非 结构 化 嵌入 式 程序 设计 的 拥护 者 指出 子 函数 调用 会 引入 相当 大 的 开销 。 这 些 开销 涉及 返 
回 地 址 存储 在 栈 中 ， 子 程序 地 址 从 存储 器 中 获得 ， 局 部 变量 ( 如 果 有 ) 被 创建 ， 以 及 从 栈 中 弹 
出 返回 地 址 。 此 外 ， 如 果 程 序 的 地 址 空间 很 大 ， 那 么 子 程序 地 址 和 返回 地 址 可 能 占用 两 个 或 两 
个 以 上 的 字 节 ,这样 在 函数 调用 结束 时 会 引发 多 次 栈 操作 。 在 听 到 这 些 议论 时 ， 人 们 可 能 禁 不 
住 会 想 是 否 资源 真 的 如 此 紧缺 ， 为 什么 我 们 不 能 采用 一 个 更 加 强大 的 处 理 器 ”软件 工程 要 求 我 
们 去 发 现 一 些 除 全 局 变量 和 非 结构 化 代码 之 外 的 方法 以 帮助 我 们 优化 性 能 。 

内 入 式 程序 员 面临 最 大 的 挑战 之 一 就 是 处 理事 件 。 事 件 会 以 任意 顺序 、 异 步 地 发 生 。 试 图 
测试 所 有 可 能 的 事件 序列 是 不 可 能 的 。 即 使 在 成 功 处 理 了 n 个 事件 后 ， 也 是 有 风险 的 ， 因 为 
n+1 个 事件 的 到 来 也 会 引发 错误 。 因此， 嵌入 式 系统 设计 者 会 仔细 地 设计 形式 化 测试 计划 以 
满足 测试 的 需要 。 在 产品 发 布 之 前 ， 应 该 对 其 功能 进行 尽 可 能 的 测试 。 对 桌面 软件 打 补 丁 已 经 
很 困难 了 ， 要 对 运行 在 数 百 万 台 设备 上 的 软件 打 补丁 几乎 是 不 可 能 的 ， 因 为 设备 的 行踪 可 能 是 
无 法 获知 和 跟踪 的 。 

对 嵌入 式 系统 进行 调试 通常 需要 设置 多 个 断 点 ， 并 进行 单 步调 试 。 但 是 ， 当 怀疑 事件 时 序 
出 现 问题 时 ， 单 步调 试 可 能 真 不 是 解决 问题 的 最 好 方式 。 许 多 嵌入 式 处 理 器 在 内 部 集成 了 调试 
接口 ， 以 揭示 一 些 芯片 内 部 的 工作 状态 。 摩 托 罗 拉 为 它 的 处 理 器 提供 了 后 台 调 试 模式 (BDM ) 。 
BDM 的 输出 可 以 通过 一 个 特别 的 “n 线 ” 连 接 器 连接 到 诊断 系统 上 。IEEE 1149. 1 联合 测试 行 
动 组 (JTAG) 接口 通过 一 个 串 行 扫描 链 来 采样 信号 ， 这 个 扫描 链 连 接 到 芯片 内 所 有 感 兴趣 的 信 
号 上 。Nexus( IEEE 5001) 是 一 个 针对 汽车 系统 设计 的 特殊 调试 器 。 和 嵌入 式 软件 调试 人 员 经 党 
发 现 他 们 使 用 示波器 和 让 辑 分 析 仪 的 频率 几乎 和 使 用 传统 调试 工具 一 样 高 。 

在 线 仿真 器 (1CE) 对 于 许多 嵌入 式 系统 设计 者 都 是 一 个 有 用 的 工具 。ICE 是 一 个 测试 工具 ， 
集成 了 微 处 理 器 执行 控制 、 存 储 器 访问 ( 读 / 写 ) 和 实时 跟踪 等 功能 。 它 由 一 个 微 处 理 器 、 一 个 
影子 寄存 器 ， 以 及 控制 仿真 器 操作 的 逻辑 构成 。ICE 开发 板 因 设计 和 性 能 而 有 所 不 同 。 购 置 和 
建立 ICE 是 很 昂贵 的 ， 而 且 ICE 的 使 用 也 很 难 学 。 然 而 ， 从 长 远 来 看 ， 它 们 可 以 给 自己 节省 很 
多 时 间 ， 并 降低 挫败 感 。 

和 普通 程序 开发 一 样 ， 编 译 器 、 汇 编 器 和 调试 器 等 工具 支持 对 于 嵌入 式 系统 设计 也 很 重 
要 。 实 际 上 ， 工 具 支 持 在 处 理 器 选 型 时 是 一 个 十 分 重要 的 因素 。 因 为 体系 结构 千差万别 ， 针 对 
某 一 种 处 理 器 的 一 组 工具 集 一 般 不 能 用 于 其 他 类 型 的 处 理 器 。 此 外 ， 简 单 地 将 一 款 处 理 器 的 纺 
泽 器 移植 到 另 一 款 处 理 器 上 可 能 无 法 产生 针对 底层 体系 结构 生成 优化 代码 的 编译 器 。 例 如 ， 将 
一 个 CISC 系统 的 编译 器 移植 到 RISC 系统 上 将 会 导致 其 无 法 充分 利用 RISC 处 理 器 中 更 多 的 寄 
存 器 。 

对 于 完全 定制 的 处 理 器 可 能 没有 任何 的 工具 支持 。 这 些 处 理 器 往往 都 是 资源 受 限 的 ， 需 要 
相当 多 的 手工 优化 以 充分 发 挥 其 性 能 。 如 果 处 理 器 受到 功 耗 的 限制 ， 则 其 设计 者 需要 尽 可 能 地 
降低 时 钟 频率 ， 所 以 优化 是 至 关 重 要 的 。 因 此 ， 构 建 一 个 不 考虑 编译 器 、 汇 编 器 或 调试 器 设计 
的 符 入 式 系统 对 于 嵌入 式 软件 开发 而 言 是 十 分 困难 的 。 然 而 ， 如 果 设计 合理 ， 这 种 埠 入 式 系统 
可 能 是 十 分 高 效 和 稳定 的 。 


本 章 小 结 

每 天 我 们 都 会 遇 到 成 百 上 千 个 嵌入 式 系统 。 由 于 它们 的 多 样 性 ,我 们 很 难 准确 地 对 其 定义 : 对 于 这 
此 系统 进行 设计 和 编程 需要 我 们 考虑 不 同 的 硬件 、 软 件 和 操作 系统 。 硬 件 和 软件 的 等 价 理论 使 得 设计 者 
在 工程 上 可 以 针对 不 同 的 性 能 和 成 本 要 求 进行 灵活 的 设计 。 对 典 入 式 系统 进行 编程 需要 对 和 硬件、 时序 和 
事件 有 深入 的 理解 。 和 嵌入 式 系统 设计 者 会 使 用 到 他 们 在 计算 机 科学 和 工程 教育 中 学 到 的 各 种 知识 。 计 算 
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机 组 成 原理 和 计算 机 体系 结构 对 于 舱 入 式 系统 设计 至 关 重要 。 对 操作 系统 概念 的 深入 理解 有 助 于 我 们 进 
行 资源 管理 和 事件 处 理 。 软 件 工程 的 知识 商定 了 编写 高 质量 代码 的 基础 。 算 法 课程 上 的 训练 使 得 嵌 人 式 
系统 设计 者 可 以 编写 出 不 需要 借助 一 些 不 安全 方法 的 高 效 程序 (如 使 用 全 局 变量 ) 。 恋 入 式 系统 在 考虑 计 
算 的 各 个 方面 时 需要 有 和 传统 设计 不 一 样 的 思维 方式 ， 包 括 软 硬 件 划分 。 

许多 在 桌面 系统 中 被 淘汰 的 处 理 器 和 操作 系统 仍 可 应 用 于 人 艇 入 式 系 统 。 它 们 容易 编程 ， 而 且 价格 便 
宜 。 这 些 最 简单 的 设备 是 微 控制 器 ， 它 通常 包含 一 个 CPU 核 、 存 储 器 (ROM 和 RAM) 、LO 端口 、LO 控 
制 器 以 及 系统 总 线 、 时 钟 和 看 门 狗 定 时 器 。 

更 为 成 熟 的 圣人 式 处 理 器 称 为 片上 系统 (SoC) ， 它 由 多 个 CPU 内 核 构成 。 这 些 处 理 器 不 一 定 使 用 相 
同 的 时 钟 和 指令 集 。 每 个 处 理 器 在 系统 中 都 针对 特定 的 任务 。 一 些 SoC 采用 由 某 些 公司 授权 的 知识 产权 
(IP) 电 路 集成 得 到 ， 这 些 公 司 是 专门 设计 和 测试 专用 电路 的 。 

使 用 可 编程 逻辑 设备 可 降低 峙 入 式 系统 开发 和 构建 原型 的 成 本 。 可 编程 好 辑 可 分 为 3 类 : 可 编程 阵 
列 逻辑 (PAL) 、 可 编程 逻辑 阵列 (PLAs) ， 以 及 现场 可 编程 逻辑 门 阵 列 (FPGA)。PAL 和 PLA 通过 熔断 熔 
丝 进 行 编程 。 它 们 的 输出 是 输入 的 乘积 和 或 者 和 乘积 的 函数 。FPGA 由 存储 单元 和 多 路 复 用 器 构成 ， 基 
于 存储 在 存储 单元 中 的 值 可 实现 任意 逻辑 功能 。FPCA 甚至 可 以 实现 自 编程 。 

对 于 骨 入 式 系统 而 言 ， 购 买 微 控制 器 比 设 计 一 个 微 控制 器 更 加 经 济 。 仅 当 需 要 大 量 芯 片 或 对 响应 性 
和 功 耗 有 严格 约束 时 ， 才 会 设计 一 款 微 控制 器 ， 因 为 仅 有 ASIC 设计 才能 满足 这 些 要 求 。 在 传统 设计 方法 
中 ， 硬 件 和 软件 设计 是 完全 隔离 的 两 个 流程 。 软 件 采 用 C、C ++ 和 汇编 进行 编写 。 硬 件 采 用 Verilog 或 
VHDL 进行 设计 。 新 出 现 的 系统 级 描述 性 语言 能 够 使 软 硬 件 设计 人 员 进 行 协同 设计 和 协同 验证 。 虽 然 
SystemC 和 SpecC 得 到 了 广泛 的 支持 ， 但 系统 级 语言 的 大 范围 应 用 还 未 到 来 。 

嵌入 式 系统 的 存储 器 组 织 形式 和 通用 系统 完全 不 同 。 特 别 是 存储 空间 中 的 很 多 部 分 可 能 是 不 可 用 的 。 
虚拟 存储 器 也 很 少 用 到 。 程 序 和 常量 通常 存储 在 只 读 存储 器 中 。 

并 不 是 所 有 的 怠 人 式 系统 都 需要 操作 系统 。 在 选择 操作 系统 时 需要 考虑 的 因素 包括 存储 空间 的 大 小 、 
响应 性 、 授 权 费 用 以 及 所 遵循 的 标准 。 硬 实时 般 入 式 系 统 对 操作 系统 有 严格 的 实时 性 限制 。 也 就 是 说 ， 
这 样 的 操作 系统 采用 抢占 式 调度 策略 并 对 优先 级 进行 预选 安排 ,特别 是 针对 中 断 的 处 理 。 目 前 市 场 上 有 
几 十 种 蔡 入 式 操 作 系统 。 其 中 最 为 流行 的 有 QNX，Windows CE，Windows Embedded 8 以 及 Embedded 
Linux。 

舱 入 式 系 统 软 件 开发 相 比 普通 应 用 软件 开发 需要 有 更 多 的 控制 ， 它 需要 对 底层 硬件 有 充分 的 了 解 。 
对 相信 式 系统 应 该 进行 更 严格 的 测试 ， 因 为 系统 失败 带 来 的 代价 是 十 分 庞大 的 。 
扩展 阅读 

有 很 多 书 都 详细 介绍 了 符 入 式 系统 的 设计 和 开发 。Berger(2002) 的 书 是 一 本 出 色 的 嵌入 式 系统 设计 
的 入 门 书籍 。Heath(2003 ) 的 书 主要 关注 嵌入 式 程序 设计 。Vahid 和 Givargis(2002) 所 著 书 籍 对 藤 入 式 系统 
组 件 给 出 了 十 分 吸引 人 的 叙述 ， 其 中 包括 用 一 章 的 篇 幅 对 艇 人 式 控制 应 用 (PID 控制 器 ) 进行 了 讲述 ， 

《 虑 人 式 系统 编程 》 杂 志 发 表 过 三 篇 很 好 的 有 关 看 门 狗 定 时 器 的 文章 。 其 中 两 篇 是 Jack Canssle(2003 ) 
撰写 的 ， 另 一 篇 的 作者 是 Niall Murphy(2000) 。 这 三 篇 文章 都 值得 一 读 。 

可 重 构 和 自 适应 系统 在 嵌入 式 系统 的 未 来 以 及 通用 计算 机 的 未 来 显得 尤为 重要 。 关 于 这 一 主题 的 许 
多 好 文章 是 由 Andrews 等 人 (2004) 、Compton 和 Hauck (2002 ) 、Prophet ( 2004 ) 、Tredennick 和 Shimato 
(2003 ) ，Verkest(2003 ) 所 写 的 。 

Berger(2002 ) 对 传统 的 和 谋 入 式 系统 设计 流程 给 出 了 详细 的 论述 。 它 描述 了 很 多 在 开发 过 程 中 可 以 使 
用 的 方法 。 该 书后 面 的 章节 主要 描述 了 测试 与 调试 ， 这 超出 了 本 章 的 范围 。Coddard(2003 ) 、Neville- Neil 
(2003) 、Shahri(2003) 和 Whitney(2003 ) 的 书 对 定制 处 理 器 编程 中 遇 到 的 两 个 最 大 挑战 ( 软 硬 件 划分 和 缺 
少 开发 工具 支持 ) 进行 了 详细 的 说 明 。 同 样 ，Daniel Gajski( 1997 ) 的 书 对 电路 设计 的 细节 给 出 了 十 分 详细 
的 介绍 。 

随 着 电路 复杂 度 的 增加 ， 艇 入 式 系统 的 协同 设计 和 协同 验证 正在 引起 广泛 关注 。 其 中 De Micheli 
(1997) 、Gupta(1997) 和 Ernst( 1998 ) 的 书 是 这 方面 很 好 的 介绍 性 文章 。Wolf( 2003 ) 的 书 对 近 十 年 的 软 硬 
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件 协同 设计 情况 进行 了 综述 ，Benini 等 人 (2003 ) 的 书 对 在 协同 设计 中 使 用 SystemC 进行 了 介绍 。 有 关 各 
种 硬件 描述 语言 的 信息 可 从 以 下 网 站 得 到 : 

SpecC: www. specc. org 

SystemC: www. systemc. org 

Real-time UML: www. omg. org 

Verilog and VHDL: www. accellera. org 

Bruce Douglass( 1999，2000) 写 了 一 本 有 关 实 时 UML 的 书 。 该 书 会 让 你 对 实时 软件 开发 有 一 个 全 新 和 
深入 的 认识 ， 以 及 从 新 角度 重新 认识 UML。Stephen J_ Mellor(2003 ) 的 书 讨论 了 如 何在 实时 系统 中 描述 可 
执行 和 可 翻译 的 UML。Lee(2005 ) 的 文章 概述 了 在 符 入 式 系 统 开发 时 计算 机 科学 所 面临 的 挑战 。 

有 关 财 和 人 式 系 统 最 新 的 信息 可 在 很 多 供应 商 的 主页 上 找到 ， 包 括 : 

ARM : www. arm. com 

Cadence Corporation: www. cadence. com 

llogix: www. ilogix. com 

Mentor Graphics: www. mentor. com 

Motorola Corporation: www. motorola. com 

Synopsis Corporation: www. synopsis. com 

Wind River System: www. windriver. com 

Xilinx Incorporated: www. xilinx. com 

其 他 的 信息 包括 : 

EDN( Electronic Design News ) : www. edn. com 

Embedded Systems Journal: www. embedded. com 

有 关 谍 入 式 操作 系统 的 网 站 包括 : 

Linux 般 入 式 操 作 系 统 : www. embeddedlinux. com 

微软 的 操作 系统 : www. embeddedwindows. com 和 www. microsoft. com 

POSIX: www. opengroup. org 

如 果 你 有 兴趣 今后 从 事 有 关内 人 式 系统 设计 的 工作 ， 那 么 在 Jack Ganssle(2002 ) 的 文章 《Breaking into 
Embedded》 中 给 出 了 一 些 建议 。 书 中 强调 学 习 骨 入 式 程序 设计 最 好 的 方式 就 是 去 动手 实践 。 书 中 还 建议 
可 入 式 系 统 设计 者 应 访问 网 站 www. stampsinclass. com 以 查询 用 于 教育 目的 的 微 控制 器 和 手册 的 购买 信 
息 。 最 近 该 网 站 推出 了 一 个 名 为 Javlin Stamp 的 PIC 微 控 制 器 ， 可 通过 Java 进行 编程 (其 他 编程 语言 也 是 
可 以 的 ) 。 
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复习 题 

. 代入 式 系统 和 通用 计算 机 有 什么 不 同 ? 

. 脱 入 式 系统 编程 和 通用 应 用 开发 有 什么 不 同 ? 

.为 什么 在 很 多 舱 入 式 系统 中 都 必须 有 看 门 狗 定 时 器 ? 
. 微 控 制 器 和 片上 系统 有 什么 不 同 ? 

. PLA 和 PAL 有 什么 不 同 ? 

.如 何 对 FPGA 进行 编程 ? 

. 列举 Gajski 提出 的 数字 综合 所 包含 的 3 个 方面 。 

. 讨论 选择 SystemC 替代 Verilog 的 原因 。 

.SpecC 和 SystemC 有 什么 不 同 ? 

. 为 什么 在 能 入 式 系统 中 通常 不 使 用 虚拟 存储 器 ? 

. 为 什么 避免 存储 溢出 对 于 舱 入 式 系统 至 关 重要 ? 
12. 实时 操作 系统 和 非 实时 操作 系统 有 什么 不 同 ? 

. 为 嵌入 式 系统 选择 操作 系统 主要 需要 考虑 哪些 因素 ? 
14. 嵌入 式 系统 软件 开发 和 普通 软件 开发 有 什么 不 同 ? 


习题 

1. 如 果 在 无 限 循环 中 包含 了 看 门 狗 定 时 器 的 复位 ， 则 会 发 生 什么 ? 列举 一 个 防止 该 情况 出 现 的 方法 。 

* 2. 在 讲解 看 门 狗 定时 器 时 ， 我 们 说 过 重启 嵌入 式 系统 比重 启 个 人 计算 机 会 花费 更 少 的 时 间 。 你 认为 为 什 
么 是 这 样 的 ? 

3. a) 请 根据 下 图 说 明 如 何 采 用 PAL 实现 一 个 两 输入 XOR 门 。 


oT - 


po 
一 一 


pk 
wy 
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b) 请 根据 下 图 说 明 如 何 采 用 PLA 实现 一 个 两 输入 NAND 门 。 


Xo XI Xo XI 


a) b) 


4: 使 用 如 下 所 示 的 FPGA 实现 一 个 全 加 器 。 请 清晰 地 标 出 输出 。 要 在 单元 之 间 进 行 连 线 以 说 明 逻 辑 功能 
之 间 的 连接 。 


x y 进位 


5. 画 出 一 个 可 在 FPGA 内 部 使 用 的 多 路 复 用 器 的 详细 逻辑 框图 。 

6. 请 陈述 在 府 入 式 系统 中 使 用 动态 存储 器 的 优 和 缺点。 是 否 应 该 在 所 有 环境 中 禁止 使 用 动态 存储 希 ? 为 
什么 ? 

7. 我 们 说 过 在 伐 入 式 操作 系统 中 ， 当 一 个 高 优先 级 的 中 断 出 现 的 时 候 ， 如 果 最 高 优先 级 的 用 户 线程 正在 
执行 ,那么 大 多 数 操作 系统 会 继续 处 理 用 户 线程 ， 而 将 中 断 保 持 在 队列 中 直到 用 户 线程 处 理 完成 。 在 
什么 情况 下 必须 这 样 处 理 ， 在 什么 情况 下 不 需要 ?请 各 举 一 例 进行 说 明 

* 8. 请 解释 中 断 延 迟 。 它 与 上 下 文 切换 时 间 的 关系 是 什么 ? 

9. 在 一 个 理想 的 欲 和 人 式 操 作 系统 中 ， 非 内 核 线程 的 优先 级 是 否 总 是 低 于 中 断 的 优先 级 ? 

10. 解释 戏 入 式 软件 开发 所 面临 的 挑战 。 设 计 者 如 何 应 对 这 些 挑战 ? 
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本 章 我 们 介绍 的 两 个 公式 会 突出 计算 机 性 能 评价 的 困境 。 一 个 人 必须 有 量化 工具 才能 测量 
性 能 ， 但 如 何 保证 为 这 个 任务 选择 的 工具 能 够 满足 评价 目标 呢 ? 事实 上 ， 谁 也 不 能 保证 。 系 统 
供应 商 更 倾向 于 使 用 其 他 的 真实 数字 ， 以 使 他 们 的 系统 看 上 去 比 竞 争 对 手 的 更 好 。 

通过 对 计算 机 性 能 评价 基础 知识 的 透彻 理解 可 以 保护 自己 不 受 大 多 数 统计 花招 的 欺骗 。 在 
选择 一 个 新 系统 或 是 试图 提升 已 有 系统 性 能 时 ， 本 章 讲授 的 基础 知识 都 是 有 用 的 。 

本 章 也 给 出 了 一 些 影响 处 理 器 性 能 、 程 序 性 能 以 及 磁盘 存储 性 能 的 因素 。 在 章 中 展示 的 思 
想 在 系统 调 优 中 备 受 关注 。 好 的 系统 性 能 评价 工具 (通常 是 由 制造 商 提供 的 ) 在 保持 系统 最 佳 
性 能 方面 是 一 个 不 可 或 缺 的 助手 。 完 成 本 章 的 学 习 之 后 ， 你 会 了 解 在 系统 调 优 报告 中 应 该 关注 
什么 ， 以 及 每 一 条 信息 如 何 与 整个 系统 性 能 相符 合 。 


11.2 计算 机 性 能 公式 

在 先前 的 章节 中 ， 读 者 已 经 了 解 了 基本 的 计算 机 性 能 评价 公式 。 作 为 测量 计算 机 性 能 的 基 
出 ， 这 个 公式 测量 的 是 CPU 时 间 : 

时 间 _ 时 间 、 时 钟 周期 、 指 令 
程序 ”时 钟 周期 上 令 ”程序 

其 中 ， 每 个 程序 的 运行 时 间 是 所 需要 的 CPU 时 间 。 这 个 公式 揭示 了 CPU 优化 能 够 对 性 能 
有 一 个 戏剧 化 的 影响 。 我 们 基于 这 个 公式 已 经 讨论 过 了 几 种 提高 性 能 的 方法 。RISC 设备 试图 
减少 每 条 指令 所 需 的 周期 数 ， 而 CISC 设备 试图 减少 每 个 程序 所 需 的 指令 条 数 。 向 量 处 理 器 和 
并 行 处 理 器 通过 减少 CPU 时 间 也 使 性 能 得 到 了 提升 。 本 章 后 续 部 分 将 介绍 其 他 几 种 提高 CPU 
性 能 的 方法 。 

CPU 优化 并 不 是 提升 系统 性 能 的 唯一 方法 。 存 储 器 和 1/0 也 对 系统 吞吐 量 有 着 非常 重要 的 
影响 。 然 而 ,存储器 和 IO 的 贡献 ， 用 上 述 公 式 是 无 法 衡量 的 。 为 了 提高 系统 的 整体 性 能 ， 我 
们 有 如 下 几 个 建议 : 

e。 CPU 优化 一 一 使 由 CPU 执行 的 速度 以 及 操作 效率 最 大 化 (性 能 公式 指出 了 这 个 优化 问题 ) 。 

。 存储 器 优化 一 一 最 大 化 一 段 代码 的 存储 器 管理 效率 。 

。1/O 优化 一 一 最 大 化 输入 /输出 操作 的 效率 。 

一 个 应 用 程序 的 总 体 性 能 受 限 于 上 述 任 何 一 个 因素 时 ， 就 可 分 别称 为 CPU 密集 型 、 存 储 
器 密集 型 或 |/O 密集 型 。 在 本 章 ， 我 们 解决 这 三 个 层次 上 的 所 有 最 优化 问题 。 

在 考察 最 优化 技术 之 前 ,我们 首先 回忆 一 下 阿 姆 达 尔 定律 (Amdahl's Law) ， 它 对 利用 各 种 
方式 可 能 获得 的 加 速 比 进行 了 限制 。 下 面 这 个 公式 描述 的 是 ， 通 过 使 用 一 些 更 快速 的 执行 方式 
获取 到 的 性 能 提升 受 限 于 更 快速 执行 方式 使 用 的 时 间 比 例 。 











ge | 

人 
其 中 ，$ 是 指 整个 系统 的 加 速 比 ; /是 由 更 快速 执行 部 件 (或 增强 器 ) 实现 的 任务 比例 ;是 新 
部 件 (或 增强 器 ) 产 生 的 加 速 比 。 
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因此 ， 当 最 常 使 用 的 部 件 的 性 能 得 到 改善 时 ， 系 统 性 能 获得 了 最 大 的 提升 。 简 言 之 ,通过 
使 常规 部 件 的 速度 加 快 ， 我 们 才能 获得 系统 性 能 提升 的 最 大 回报 。 了 解 一 个 系统 或 应 用 程序 是 
CPU 密集 型 、 存 储 上 咒 密 集 型 或 /0 密集 型 是 提升 系统 性 能 的 第 一 步 。 当 阅读 提升 性 能 的 讨论 
时 ， 脑 子 里 要 始终 记 着 这 一 点 。 我 们 首先 讨论 测量 整体 性 能 的 几 种 不 同方 式 ， 接 着 给 出 与 单个 
系统 部 件 性 能 相关 的 几 个 因素 。 然 而 ， 在 开始 讨论 这 些 内 容 之 前 ， 我 们 首先 要 介绍 几 个 必需 的 
数学 概念 来 理解 常规 的 计算 机 性 能 评测 标准 。 


11.3 数学 准备 工作 
计算 机 性 能 评价 是 一 个 定量 的 科学 。 数 学 和 统计 学 工具 给 我 们 提供 了 几 种 方法 来 评价 某 系 
统 的 整体 性 能 以 及 它 的 各 个 组 成 部 分 的 性 能 。 实 际 上 ， 有 很 多 方法 可 以 量化 系统 性 能 以 至 于 选 
择 合适 的 统计 方法 越 来 越 成 为 性 能 评估 的 挑战 。 本 节 中 ,我 们 描述 了 最 常见 的 测量 “平均 " 
计算 机 性 能 的 方法 ， 然 后 提供 了 每 一 种 方法 适用 以 及 不 适用 的 情形 。 在 本 节 的 第 二 部 分 ,我 们 
提出 了 通过 错误 推理 发 现在 定量 信息 不 适用 时 的 其 他 评价 方法 。 在 这 之 前 ， 我 们 还 得 按 顺序 先 
给 出 几 个 定义 。 
系统 性 能 的 测量 取决 于 个 人 的 观点 。 计 算 机 用 户 更 关注 响应 时 间 : 这 个 系统 花费 多 长 时 间 
来 实现 一 个 任务 ? 系统 管理 员 更 关注 吞吐 量 : 在 没有 损害 响应 时 间 的 情况 下 ， 这 个 系统 能 实现 
多 少 个 并 发 任务 ”这 两 种 观点 是 相反 的 。 特 别 地 ， 如 果 一 个 系统 在 上 秒 内 可 实现 一 个 任务 ， 那 
么 每 秒 的 吞吐 量 就 是 1/k。 
当 比较 两 个 系统 的 性 能 时 ， 我 们 测量 每 个 系统 实现 相同 任务 量 的 时 间 。 如 果 系 统 A 和 系统 
B 运行 相同 的 程序 ， 如 果 
在 系统 B 上 的 运行 时 间 ，， 
在 系统 A 上 的 运行 时 间 





系统 A 比 系统 B 快 na 倍 。 如 果 
(夺权 纯情 二 的 加 本 时 国 1 
在 系统 A 上 的 运行 时 间 





|) = 


系统 A 比 系统 B 快 x% 倍 。 
考虑 两 辆 赛车 的 性 能 。A 车 在 3min 内 跑 了 10mile( lmile = 1609. 344m) ， 而 B 车 完成 相同 

的 10mile 花费 了 4min。 使 用 我 们 的 性 能 公式 可 知 ，A 车 的 性 能 就 是 B 车 的 1.33 倍 : 
汽车 B 行驶 10mile 的 用 时 _ 4 
汽车 A 行驶 10mile 的 用 时 3 
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而 A 车 比 B 车 快 33%: 
泊 生 了 行 浆 10mile 的 用 时 (4 
汽车 A 行驶 10mile 的 用 时 3 
这 个 公式 在 比较 两 个 系统 的 平均 性 能 时 是 有 用 的 。 然 而 ， 当 比较 实际 系统 的 性 能 时 ， 这 个 作为 
结果 的 数字 过 分 依赖 于 “平均 ”的 定义 了 。 


11. 3. 1 均值 的 含义 

统计 学 家 告诉 我 们 如 果 需 要 有 用 的 信息 ， 则 必须 进行 适当 次 数 的 实验 并 且 根 据 实验 结果 证 
明 推 论 是 正确 的 。 若 想 实 验 当 中 的 可 变性 越 大 ， 样 本 的 数量 就 得 越 多 。 当 我 们 完成 “足够 " 
多 数量 的 实验 之 后 ， 剩 下 的 任务 就 是 用 某 种 方法 对 有 意义 的 数据 进行 组 合 或 者 平均 ， 从 而 建立 
一 个 简要 的 集中 趋势 的 测度 。 集 中 趋势 的 测度 为 我 们 表明 了 采样 系统 (总 体 ) 的 期 望 行为 。 但 
不 是 所 有 的 平均 数值 的 方法 都 是 相等 的 。 我 们 选择 的 方法 取决 于 数据 本 身 的 特性 ， 以 及 实验 结 
果 的 统计 分 布 。 





-1) x 100 = 33% 








算术 平均 

算术 平均 是 每 个 人 都 最 熟悉 的 一 种 方法 。 如 果 我 们 有 5 个 测量 值 ， 将 它们 相 加 求 和 并 除 以 
5， 则 结果 就 是 算术 平均 。 当 人 们 倾向 于 某 些 测量 的 平均 结果 时 一 一 比如 ， 计 算 过 去 一 年 中 消 
耗 汽油 的 成 本 一 一 他 们 往往 取 价格 的 算术 平均 ， 这 些 价格 是 在 某 些 特定 频率 上 进行 取样 的 。 

当 样本 数据 剧烈 变化 或 向 较 低 值 或 较 高 值 偏 斜 时 不 应 该 使 用 算术 平均 值 。 考 虑 表 11-1 所 
示 3 台 计 算 机 的 性 能 值 。 给 出 的 值 是 每 个 系统 运行 5 个 测量 程序 所 需 的 时 间 。 观 察 运行 时 间 ， 
我 们 可 以 看 出 这 3 个 系统 的 性 能 是 有 显著 不 同 的 。 如 果 我 们 仅仅 报告 运行 时 间 的 算术 平均 值 ， 
那么 这 个 事实 就 会 完全 隐藏 了 。 

表 11-1 在 3 个 系统 中 5 个 程序 运行 时 间 的 算术 均值 (以 秒 为 单位 ) 





| ”系统 A 的 运行 时 间 系统 B 的 运行 时 间 系统 C 的 运行 时 间 


V 50 100 500 


























Ww 200 400 600 
x 250 500 500 
y 400 800 800 
z 5 000 4100 3 500 
平均 值 1 180 1180 1 180 


当 使 用 正确 时 ， 加 权 算 术 平 均 可 以 改善 算术 平均 的 缺点 ， 因 为 加 权 平 均 可 以 对 系统 的 期 望 
行为 给 一 个 更 清晰 的 刻画 。 如 果 有 了 这 些 系 统 每 天 分 别 运行 这 5 个 程序 的 频率 ， 那 么 我 们 就 能 
使 用 执行 时 间 混 合计 算 这 些 系 统 各 自 相 关 的 期 望 性 能 。 加 权 平均 是 通过 对 所 运行 的 每 一 个 程序 
的 运行 时 间 和 执行 该 程序 的 频率 相 乘 后 求 和 得 到 的 。 将 加 权 的 运行 时 间 进 行 平 均 就 得 到 了 加 权 
算术 平均 。 

表 11-2 重新 列 出 了 表 11-1 中 给 出 了 系统 A 和 系统 C 的 运行 时 间 。 我 们 已 经 补充 了 每 个 程 
序 带 有 执行 频率 的 运行 时 间 。 比 如 ， 在 系统 A 中 ， 每 个 组 合 执 行程 序 v、w、x、y 和 z100 次 ， 
程序 y 运 行 5 次 。 在 系统 A 中 这 5 个 程序 的 执行 时 间 的 加 权 平 均 为 : 

(50 x0.5) + (200 x 0.3) + (250 x 0.1) + (400 x 0.05) + (5000 x 0.05) = 380 
表 11-2 两 个 系统 中 5 个 程序 混合 运行 以 及 运行 时 间 的 加 权 平 均 
| 二 ”系统 A 的 运行 时 间 系统 C 的 运行 时 间 



























50% 50 500 
w | 30% 200 600 
| 10% 250 500 
| 5% 400 800 
和 | 5% 5 000 3 500 
加 权 平 均值 380s | 695s 


类 似 的 一 个 计算 指出 了 在 系统 C 中 对 这 5 个 程序 的 执行 时 间 的 加 权 平均 为 695s。 对 给 定 的 
工作 负载 使 用 加 权 平 均 ， 我 们 可 以 清楚 地 看 到 系统 A 比 系统 C 快 了 83% 左右 

使 用 加 权 平 均 最 容易 引起 的 麻烦 是 使 用 不 随时 间 推 移 的 假设 。 假 设 某 公 司 的 计算 机 工作 负 
载 给 出 的 混合 执行 时 间 如 表 11-2 所 示 。 基 于 这 些 信息 ， 公 司 会 购买 系统 A 而 不 是 系统 C。 假 
设 一 个 聪明 的 用 户 ( 称 他 为 Wally 吧 ) 计 算出 程序 z 会 给 出 和 运行 程序 v 一 样 的 结果 ， 继 而 将 结 
果 作 为 程序 w 的 输入 。 因 为 程序 z 需 要 花费 好 长 时 间 来 运行 ， 所 以 Wally 就 有 足够 的 理由 去 喝 
咖啡 了 。 不 久之 后 ，Wally 的 发 现 就 传 遍 了 办 公 室 ， 并 且 组 里 的 每 一 个 人 都 开始 效仿 他 的 做 法 . 
短 短 数 日 ， 系 统 A 的 工作 负载 看 上 去 就 像 表 11-3 所 示 的 一 样 。 管 理 层 肯定 不 知道 为 什么 他 们 





引进 的 系统 A 突然 之 间 性 能 就 如 此 差 了 。 
表 11-3 系统 A 使 用 修改 后 的 混合 执行 时 间 产 生 的 加 权 平 均 运 行 时 间 





























程序 执行 时 间 执行 频率 
50 25% 
w | 200 中 5% 
x | 250 10% 
y 400 5% 
Zz 二 5 000 | 55% 

加 权 平 均值 2.817. 5s 

几何 平均 


从 前 面 的 讨论 中 可 知 ， 如 果 测 量 呈 现 出 很 大 的 不 确定 性 就 不 能 使 用 算术 平均 。 进 一 步 说 ， 
ee te de pte ede te te 
给 我 们 一 个 一 致 的 数字 来 实现 性 能 的 比较 ， 而 不 用 考虑 数据 分 布 。 

形式 上 ， 几 何平 均 定义 为 n 次 测量 乘积 的 n 次 方 根 。 可 以 用 下 述 公 式 来 描述 : 

信守 i 

当 需 要 比较 两 个 系统 的 相对 性 能 时 ， 几 何平 均 比 算术 平均 对 我 们 更 有 用 。 当 性 能 被 表述 为 

与 一 台 作 为 参考 的 普通 机 器 的 性 能 有 关 时 ， 性 能 结果 则 很 容易 比较 。 当 我 们 将 参考 机 中 一 个 程 
序 运 行 时 间 的 比例 用 到 正在 评价 系统 的 相同 程序 的 运行 时 间 上 时 ， 我 们 就 说 把 接受 评估 的 系统 
规范 化 到 了 参考 机 器 上 。 

为 了 找到 规范 化 比值 的 几何 平均 ， 我 们 使 用 个 比值 乘积 的 次 方 根 。 系 统 A 和 系统 C 规 
范 化 到 系统 B 上 的 几何 平均 可 以 利用 如 下 计算 方式 : 

系统 A 的 几何 平均 = (100/50 x 400/200 x 500/250 x 800/400 x 410075000) 
~ 1. 6733 


系统 C 的 几何 平均 = (100/500 x 400/600 x 500/500 x 800/800 x 4100/3500)3 
~ 0. 6898 


计算 细节 见 表 11-4。 
刘 习 =4 de de 





























, 3 500 1.1714 
几何 平均 | 67133 1 0.6898 

















几何 平均 的 一 个 很 好 的 特性 是 不 管 我 们 选择 哪个 系统 作为 参考 系统 ， 得 到 的 结果 都 是 一 样 
的 。 表 11-5 给 出 了 当 系 统 C 为 参考 机 时 的 结果 。 注 意 ， 几 何平 均 的 比例 是 一 致 的 ， 而 不 管 我 
们 为 参考 机 选择 哪个 系统 。 

系统 A 上 的 几何 平均 
系统 B 上 的 几何 平均 





~= 1.67 
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系统 B 上 的 几何 平均 
系统 C 上 的 几何 平均 
系统 A 上 的 几何 平均 、，43 
系统 C 上 的 几何 平均 ““ 


表 11-5 当 系 统 C 作为 参考 系统 时 的 几何 平均 


系统 A 的 规范 化 到 系统 C 系统 B 的 规范 化 到 系统 C 系统 C 的 。 | 规范 化 到 系统 C 
运行 时 间 的 执行 时 间 运行 时 间 的 执行 时 间 运行 时 间 的 : 
50 10 5 


~ 1.45 









































| 1 
汪 200 400 600 | 1 
5 250 2 500 1 500 1 
400 2 800 1 | 800 + 1 
5 000 0.7 4 100 0.8537 350 | 1 
几何 平均 2.4258 1.4497 ] I 


如 果 使 用 系统 A 作为 参考 系统 ， 我 们 会 发 现 比 例 是 相同 的 。 

几何 平均 证 实 了 我 们 对 系统 A 和 系统 C 相对 性 能 的 直觉 。 通 过 使 用 几何 平均 的 比例 值 ， 
我 们 看 到 系统 A 给 出 的 结果 与 系统 B 的 结果 差 太 多 了 。 然 而 ， 几 何平 均 是 非 线 性 的 。 尽 管 系统 
A 相对 系统 C 的 几何 平均 比例 是 2.43， 这 也 并 不 意味 着 系统 C 就 比 系统 A 快 2.43 信 。 通 过 原 
始 数据 可 以 很 明显 看 出 这 个 事实 。 因 此 购买 了 系统 C 的 客户 如 果 想 着 会 得 到 双 倍 于 系统 A 的 
性 能 的 话 ， 那 么 他 肯定 会 失望 的 。 不 同 于 加 权 算 术 平 均 ， 几 何平 均 在 建立 系统 实际 行为 的 统计 
期 望 时 毫 无 帮助 。 

几何 平均 的 第 二 个 问题 是 一 个 很 小 的 值 就 会 对 整个 结果 产生 不 成 比例 的 影响 。 比 如 说 ， 如 
果 系 统 C 的 制造 商 将 测试 中 运行 最 快 (可 能 最 简单 ) 的 程序 性 能 提高 了 20% ， 那 么 它 的 运行 时 
间 就 会 由 500s 降低 到 400s， 规 范 化 的 几何 平均 将 提高 4.5% 以上。 如果 我 们 将 最 快 程序 的 性 能 
提高 40% ( 即 300s 内 运行 完毕 ) ， 则 规范 化 的 几何 平均 值 将 提高 16% 以 上 。 不 管 是 提高 20% 还 
是 40% 的 性 能 ， 我 们 都 能 看 到 相关 的 几何 平均 有 同样 的 减少 。 人 们 可 能 会 认为 从 一 个 大 型 复 
杂 的 程序 中 减少 700s 比 从 一 个 更 小 的 简单 的 程序 中 减少 200s 还 困难 。 实 际 上 (根据 阿 姆 达尔 
定律 ) ， 这 是 最 大 耗 时 最 长 的 程序 ， 并 且 这 些 程序 对 系统 性 能 影响 最 大 。 

当 数 据 以 一 个 速率 表示 时 (比如 每 秒 操作 的 次 数 ) ， 不 管 是 几何 平均 还 是 算术 平均 都 是 不 
合适 的 。 对 于 平均 速率 或 者 比例 应 该 使 用 调和 平均 。 调 和 平均 使 我 们 能 够 建立 一 个 关于 吞吐 量 
的 数学 期 望 ， 并 比较 系统 或 系统 组 件 的 相关 吞吐 量 。 为 了 求 得 调和 平均 ， 需 要 将 每 一 个 数 的 倒 
数 求 和 ， 并 除 以 数据 元 素 的 总 个 数 n。 数 学 描述 如 下 : 

H=is (x +t l/s + 1 + 5 7 ) 

为 了 和 弄 明 白 调 和 平均 如 何 应 用 到 速率 上 ， 考 虑 一 个 开 汽 车 旅行 的 简单 例子 。 假 设 旅途 为 
30mile， 前 10mile 以 30mile/bh 的 速度 前 行 ， 中 间 10mile 的 行驶 速度 为 40mile/h， 最 后 10mile 则 
以 60mile/h 的 速度 行进 。 如 果 对 上 述 速度 求 算 术 平 均 ， 则 整个 旅途 的 速度 均值 为 43. 3mile/h。 
这 是 不 正确 的 。 因 为 前 10mile 需要 的 时 间 是 hM3。 中 间 10mile 需要 h/4， 而 最 后 10mile 需要 h/6。 
整个 旅途 总 共 需 要 的 时 间 为 3h/4， 故 平均 速度 等 于 30mile +3h/4 =40mile/h。 调 和 平均 给 我 们 
一 个 如 下 正确 的 答案 : 

3=(1/30 +1/40 + 1/60) = 40mile/h 

在 这 个 例子 中 , 为 了 计算 出 给 定 距离 的 平均 速度 ,我 们 不 得 不 小 心地 使 每 一 段 距 离 都 相 

等 。 男 一 方面 ， 如 果 汽 车 以 每 小 时 60mile 的 速度 行驶 了 100mile( 代替 10mile) ， 则 调和 平均 值 





是 一 样 的 。 调 和 平均 并 不 告诉 它 是 如 何 工作 的 ， 仅 让 我 们 知道 了 它 的 平均 速率 是 多 少 。 

调和 平均 有 几何 平均 所 没有 的 两 个 优势 。 首 先 ， 它 可 以 预测 机 器 的 行为 。 因 此 ， 它 除了 表 
示 系 统 性 能 之 外 也 有 其 他 用 途 。 其 次 ， 比 起 耗 时 少 的 程序 ， 更 耗 时 的 程序 对 调和 平均 的 影响 更 
大 。 这 一 事实 不 仅 与 “ 快 适 应 ”优化 有 关 ， 而 且 也 反映 了 现实 就 是 如 此 。 大 且慢 的 任务 会 比 
小 而 快 的 程序 占用 更 多 的 机 器 周期 。 因 此 ， 通 过 提升 它们 的 性 能 ， 我 们 可 以 获得 的 提升 也 
更 多 。 

和 几何 平均 一 样 ， 调 和 平均 也 可 以 用 于 相对 性 能 的 比率 。 然 而 ， 调 和 平均 对 参考 机 的 选择 
更 为 敏感 。 换 名 话说， 调和 平均 的 比率 不 像 几 何平 均 那么 稳定 。 但 是 ， 在 几何 平均 能 比较 机 器 
性 能 之 前 , “工作 ”的 定义 必须 先 建立 起 来 。 在 稍 后 的 章节 中 ， 将 会 看 到 这 是 一 个 多 么 聪明 的 
想法 。 

我 们 用 一 个 公路 旅行 的 例子 说 明了 算术 平均 不 合适 求 取 平 均 速 率 。 使 用 算术 平均 表示 规范 
化 的 比率 也 是 不 正确 的 。 每 一 种 均值 的 适用 范围 总 结 见 表 11-6。 


表 11-6 数据 特点 及 适用 的 均值 
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偶尔 ,会 在 最 不 该 使 用 这 种 统计 方法 的 地 方 使 用 它 。 在 公正 客观 地 评价 系统 性 能 过 程 中 ， 
均值 的 误 用 仅 是 各 种 陷阱 中 的 一 个 。 


11. 3.2 统计 学 和 语义 

人 性 迫使 我 们 用 可 能 更 好 方法 来 修炼 更 好 的 自己 和 我 们 的 信仰 。 人 们 试图 将 他 们 的 产品 卖 
给 我 们 ， 他 们 的 动机 和 自我 生存 一 样 重要 。 当 一 个 产品 被 华而不实 的 演示 和 广告 所 包围 时 ， 我 
们 很 难看 到 它 真正 的 光芒 一 一 即使 这 个 产品 确实 很 好 。 具 有 这 种 修辞 学 逻辑 概念 的 读者 可 能 会 
理解 夸张 推理 是 如 何 用 于 销售 和 广告 中 的 。 一 个 经 典 的 例子 就 是 一 名 演员 “在 电视 上 扮演 一 个 
医生 ”并 推荐 一 种 治疗 某 种 疾病 的 特效 药 。 在 修辞 逻辑 中 ， 这 称 为 诉 诸 权 威 的 争论 ， 即 “向 
无 资格 权威 挑战 ”的 雇 论 。 除 非 一 名 演员 有 医学 学 位 ， 否 则 他 没有 资格 对 任何 疾病 的 任何 治疗 
的 适应 性 进行 断言 。 尽 管 我 们 不 经 常 看 到 “在 电视 上 扮演 计算 机 科学 家 ”的 演员 来 推荐 大 型 
机 ， 但 一 些 计算 机 销售 商 的 腔调 也 会 成 为 熟知 自己 需求 的 顾客 的 一 个 娱乐 来 源 。 

计算 机 购买 者 常常 被 计算 机 销售 资料 中 所 引用 的 数字 给 吓 住 了 。 前 面 我 们 已 经 提 到 过 ， 平 
均值 是 如 何 误 用 的 。 即 使 是 使 用 正确 的 统计 学 ， 对 很 多 人 来 说 ， 它 也 不 容易 理解 。 销 售 商 提供 
的 “量化 ”信息 经 常会 给 他 们 所 谓 的 优越 性 能 增添 可 信 的 光环 。 在 11.4 节 ， 我们 讨论 几 个 客 
观 评价 计算 机 性 能 的 方法 ， 声 誉 好 的 销售 商会 不 加 修饰 地 引用 这 些 方法 ， 但 即使 是 很 优秀 的 评 
价 方法 也 会 被 误 用 。 在 接 下 来 的 几 节 中 ， 将 会 介绍 3 个 在 购买 新 硬件 或 系统 软件 时 可 能 会 遇 到 
的 常见 的 修辞 雇 论 。 我 们 为 你 的 娱乐 性 和 计算 机 性 能 的 启蒙 提供 了 同样 多 的 资料 。 

不 完整 信息 

2002 年 年 初 ， 有 一 个 整 版 广告 刊登 在 了 主要 商业 和 贸易 杂志 上 。 广 告 的 要 点 是 :“ 我 们 对 
产品 进行 了 测试 并 公布 了 结果 。 供 应 商 X 没有 为 他 的 产品 发 布 同样 的 测试 结果 ， 因 此 ,我们 的 
产品 更 快 。 喻 ?你 真正 知道 的 就 是 广告 中 引用 的 几 个 统计 数字 。 它 没有 提 到 产品 任何 的 相对 
性 能 。 





有 时 ， 这 种 不 完整 信息 廖 论 采取 的 形式 是 ， 供 应 商 只 引用 良好 的 测试 结果 ， 而 绝口 不 提 在 
同一 时 刻 同样 系统 上 也 产生 了 不 太 好 的 测试 结果 。 一 个 例子 就 是 “单一 品质 因数 ” 。 供 应 商 只 
聚焦 于 一 个 单一 的 性 能 指标 ， 这 个 指标 使 得 他 们 的 系统 在 竞争 中 具有 市 场 优 势 ， 而 实际 上 ， 这 
些 单独 的 度量 在 系统 的 实际 工作 负载 中 并 不 具有 代表 性 。 不 完全 信息 的 另 一 种 表现 方式 是 ， 一 
个 供应 商 只 引用 “峰值 ”性 能 数字 ， 而 省 略 了 平均 或 更 常见 的 期 望 情况 。 

模糊 信息 与 不 适当 的 度量 

在 评估 系统 的 相对 性 能 时 ， 不 精确 的 词汇 (如 “多 ”“ 少 ” “接近 ” “事实 上 ”“ 几 乎 ”以 
及 它们 的 同义词 ) 总 会 立刻 引起 人 们 的 警惕 。 如 果 这 些 术语 有 适当 数据 的 支持 ， 那 么 它们 的 使 
用 可 能 是 公正 的 。 然 而 ， 细 心 的 读者 可 能 会 了 解 到 ,“ 接 近 ” 可 能 意味 着 产品 A 和 产品 B 之 间 
“ 仅 有 ”50% 的 性 能 差异 。 

最 近 一 本 赞美 某 品 牌 系统 软件 的 小 册子 ,恰好 说 明了 不 恰当 使 用 测量 指标 产生 的 不 精确 
性 。 宣 传单 上 粗略 地 说 ,“ 软件 A 和 软件 B 都 运行 了 测试 程序 X。 我 们 有 软件 B 运行 测试 软件 
Y 的 结果 。 我 们 已 证 明 测试 程序 X 几乎 总 是 和 测试 程序 Y 是 等 价 的 。 因 此 我 们 得 出 软件 A 更 
快 的 结论 ” 。 到 底 测试 程序 X 和 测试 程序 Y 不 等 价 到 什么 程度 ? 有 无 可 能 是 测试 程序 X 使 软件 
A 看 上 去 更 好 ? 

吸引 人 气 

这 个 廖 论 是 迄今 为 止 最 常见 的 ， 通 常 也 是 在 一 群 人 (如 计算 机 采购 委员 会 ) 中 最 难 防范 的 。 
它 通常 会 宣称 :“ 我 们 的 产品 被 美国 财富 500 强大 公司 中 的 X% 所 使 用 。” 这些 无 可 争辩 的 事实 
表明 这 个 公司 运转 恨 好 ， 并 且 可 能 是 值得 信赖 和 稳定 的 。 而 这 些 非 量化 的 因素 在 系统 和 软件 的 
选择 中 确实 是 非常 重要 的 。 但 是 ， 不 能 因为 X% 的 财富 500 强 公司 使 用 这 个 产品 ， 就 表示 此 产 
品 也 适合 你 的 业务 。 这 是 一 个 更 加 复杂 的 问题 。 


11.4 基准 测试 

性 能 基准 测试 是 对 一 个 系统 相对 另 一 个 系统 的 性 能 做 出 客观 评价 的 一 门 科学 。 在 评价 通过 
升级 一 台 计 算 机 或 者 其 组 成 部 分 带 来 的 性 能 提升 时 ， 基 准 测试 也 是 有 用 的 。 好 的 基准 测试 使 我 
们 能 够 减少 广告 宣传 和 统计 伎俩 带 来 的 误导 。 最 终 ， 良 好 的 基准 测试 将 可 以 识别 出 以 最 合理 的 
成 本 提供 良好 性 能 的 系统 。 t 

尽管 经 过 仔细 挑选 之 后 ,“ 合 理 ” 成 本 的 问题 通常 是 显而易见 的 , 但 “好 ”的 性 能 却 是 难 
以 捉摸 的 ， 它 会 否定 几 十 年 来 所 有 对 它 的 定义 。 然 而 ,良好 的 性 能 是 在 “看 到 它 时 就 知道 ” 
的 一 个 事情 ， 而 糟糕 的 性 能 肯定 会 使 你 的 生活 苦 不 堪 言 ， 直 到 问题 得 到 纠正 。 简 言 之 ， 当 计算 
机 系统 使 用 最 少 的 执行 时 间 ( 或 系统 时 间 ) 来 运行 应 用 程序 时 ， 就 可 以 获得 最 佳 性 能 。 同 样 的 
计算 机 系统 不 一 定 能 在 最 短 的 时 间 内 运行 其 他 的 应 用 程序 。 

如 果 有 某 种 方法 能 够 将 系统 按照 单一 的 性 能 数值 或 指标 进行 分 类 ， 那 么 计算 机 购买 者 的 生 
活 就 会 变 得 容易 多 了 。 这 种 方法 的 一 个 明显 的 优点 是 ， 对 计算 机 不 了 解 或 者 知之 甚 少 的 人 会 知 
道 他 们 付出 的 金钱 会 在 什么 时 候 获 得 了 良好 的 使 用 价值 。 如 果 我 们 有 一 个 简单 的 指标 ， 那 么 我 
们 可 以 使 用 价格 性 能 比 来 确定 哪个 系统 是 最 值得 购买 的 。 

例如 ， 我 们 定义 了 一 个 虚构 的 包罗 万 象 的 系统 度量 称 为 “活力 ”。 一 个 提供 150 个 活力 的 
150 000 美元 的 系统 将 会 比 提供 120 个 活力 的 125 000 美元 的 系统 更 值得 购买 。 第 一 个 系统 的 价 
格 性 能 比 是 : 

150 000 美元 ”1000 美元 
150 个 活力 “活力 
而 第 二 个 系统 的 价格 性 能 比 是 : 








125 000 美元 ”1042 美元 
120 个 活力 “活力 
问题 就 变 成 了 你 是 否 能 接受 120 个 活力 并 节省 25 000 美元 的 计算 机 ， 或 者 直接 去 购买 “大 
的 经 济 机 型 ”更 好 ， 在 彻底 探讨 系统 性 能 之 前 ， 了 解 这 些 需 要 一 点 时 间 。 
这 个 方法 的 一 个 问题 就 是 这 里 没有 一 个 关于 计算 机 性 能 的 统一 度量 标准 ， 比 如 “活力 ” 
这 个 标准 应 该 对 在 所 有 负载 类 型 下 的 所 有 系统 都 是 适用 的 。 因 此 ， 如 果 你 正在 寻找 一 个 能 处 理 
大 量 (LO 密集 型 ) 事务 处 理 的 系统 (比如 航空 预订 系统 ) ， 那 么 应 该 更 关心 IO 性 能 而 不 是 CPU 
速度 。 同 样 地 ， 如 果 你 的 系统 将 运行 计算 密集 型 (CPU 密集 型 ) 应 用 程序 (比如 天 气 预 报 或 计算 
机 辅助 绘图 ) ， 那 么 主要 的 关注 点 就 应 该 是 CPU 能 力 ， 而 不 是 IO。 


MIPS... OR... OOPS? 


在 20 世纪 70 年 代 和 80 年代， 两 大 计算 机 制造 商 [LIBM 和 数字 设备 公司 (DEC)] 之 间 的 竞 
争 非常 激烈 。 尽 管 DEC 并 不 制造 大 型 计算 机 ， 但 它 的 最 大 型 系统 也 适用 于 那些 由 IBM 小 型 系 
统 服务 的 客户 。 

为 了 打开 新 品牌 VAX 11/780 的 市 场 ，DEC 的 工程 师 在 IBM 370/158 和 VAX 机 上 分 别 运 行 
了 一 些小 的 综合 基准 程序 。 在 IBM 传统 市 场 销售 的 370/158 为 “1 MIPS” 机 器 。 所 以 当 基 准 程 
序 在 VAX 11/780 上 运行 时 间 也 同 370/158 一 样 时 ，DEC 开始 将 其 作为 竞争 “1 MIPS” 的 系统 
进行 销售 。 

VAX 11/780 是 一 个 商业 上 的 成 功 。 这 个 系统 很 受 欢迎 也 因此 成 为 了 标准 的 1 MIPS 系统 。 
很 多 年 以 来 ，VAX 11/780 都 是 众多 基准 测试 的 参考 系统 。 可 以 对 这 些 基准 测试 的 结果 进行 推 
断 ， 以 推导 出 被 测 系 统 的 “近似 MIPS” 评 级 。 

毫 无 疑问 ，VAX 11/780 的 计算 能 力 和 IBM 370/158 不 相 上 下 。 但 它 成 为 一 台 “1 MIPS” 
机 器 前 并 没有 受到 更 严密 的 审查 。 已 经 证 实 为 了 运行 基准 测试 程序 ， 由 于 其 有 特定 的 ISA， 所 
以 VAX 11/780 只 执行 了 大 约 500 000 条 机 嚣 指令。 因此， 实际 上 ,“1 MIPS 标准 系统 ”归根 结 
底 兵 是 一 个 0.5 MIPS 的 系统 。 后 来 DEC 通过 指定 VUP( VAX 机 组 性 能 ) 来 销售 设备 ，VUP 表明 
一 个 设备 相对 VAX 11/780 的 速度 。 





11. 4.1 时 钟 频 率 、MIPS 和 FLOPS 


CPU 速度 本 身 就 是 一 种 具有 误导 性 的 度量 标准 ，( 不幸 的 是 , ) 这 是 计算 机 制造 商 经 常 吹 中 
自己 的 系统 优 于 其 他 系统 的 一 个 标准 。 在 体系 结构 相同 的 系统 上 ， 一 个 CPU 如 果 以 双 倍 于 另 
一 个 CPU 时 钟 频 率 在 运行 ,那么 它 能 获取 更 好 的 吞吐 量 。 但 是 当 比 较 不 同 制造 商 的 产品 时 ， 
两 个 系统 可 能 不 会 有 相同 的 体系 结构 。( 否则 ， 两 者 都 无 法 声称 其 性 能 优势 超越 另 一 方 。) 

和 时 钟 频 率 相 关 的 一 个 广泛 引用 的 标准 是 每 秒 百 万 条 指令 (MIPS) 。( 但 是 ， 很 多 人 认为 
MIPS 其 实 表示 “销售 员 无 价值 的 性 能 指标 ”!) 这 个 指标 测量 的 是 系统 执行 一 个 典型 的 混合 了 
浮 点 运算 、 整 数 算术 运算 、 逻 辑 运算 指令 的 速率 。 反 过 来 ,这 个 标准 最 大 的 弱点 就 是 不 同 的 机 
器 结构 通常 需要 不 同 的 机 器 周期 数 来 实现 一 个 给 定 的 任务 。MIPS 标准 并 不 统计 完成 某 个 特定 
任务 所 需要 的 指令 条 数 。 

当 我 们 比较 RISC 系统 和 CISC 系统 的 性 能 时 ， 可 以 看 到 最 明显 的 差别 。 我 们 让 每 一 个 系统 
都 执行 整数 除法 运算 。CISC 系统 在 产生 最 终结 果 之 前 需要 执行 20 条 二 进 制 机 器 指令 。RISC 系 
统 可 能 需要 执行 60 条 。 如 果 这 两 种 系统 都 是 在 1s 之 内 输出 结果 ， 那 么 RISC 系统 的 MIPS 速率 
会 是 CISC 系统 的 3 倍 。 但 我 们 能 够 说 RISC 的 速度 是 CISC 的 3 倍 吗 ? 当然 不 能 ， 在 两 种 情况 
下 ,我 们 都 是 1s 之 内 得 到 结果 了 。 
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FLOPS( 每 秒 浮 点 运算 数 ) 标 准 也 有 类 似 的 问题 。Megaflops 或 MFLOPS， 是 早 在 描述 超级 
计算 机 功率 时 使 用 的 一 个 标准 ， 但 现在 也 用 于 个 人 计算 机 。FLOPS 比 MIPS 更 令 人 困扰 ， 因 为 
对 浮 点 运算 的 构成 没有 一 个 统一 的 意见 。 在 第 2 章 中 ,我 们 解释 了 计算 机 是 如 何 通 过 算术 移 位 
和 加 法 运算 实现 乘法 和 除法 的 。 在 每 一 个 原始 运算 中 ， 都 会 处 理 浮 点 数 。 因 此 我 们 能 说 计算 一 
个 立即 数 的 部 分 和 是 一 种 浮 点 运算 吗 ? 如 果 是 ,并且 度量 标准 是 FLOPS 的 话 ， 那 么 我 们 就 能 
惩罚 那些 使 用 高 效 算法 的 销售 商 了 。 高 效 算法 可 以 使 用 更 少 的 步骤 得 到 相同 的 结果 。 如 果 求 得 
结果 消耗 的 总 时 间 和 使 用 低 效率 算法 所 用 的 总 时 间 相 同 ， 那 么 高 效 系统 的 FLOPS 速率 是 低 的 。 
如 果 我 们 并 不 准备 执行 部 分 和 计算 的 步骤 ,那么 怎么 才能 执行 其 他 浮 点 加 法 操作 ? 更 进一步 
说 ， 有 些 计算 机 根本 就 不 用 浮 点 运算 指令 。( 早 期 的 Cray 超级 计算 机 和 IBM PC 通过 整数 程序 
模拟 浮 点 运算 。) 因为 FLOPS 标准 仅 将 浮 点 运算 考虑 在 内 ， 单 单 基于 这 个 标准 ， 这 些 系统 将 是 
相当 差劲 的 ! 然而 ， 像 MIPS 一 样 ，MFLOPS 是 一 个 在 销售 人 员 中 流行 的 度量 标准 ， 因 为 它 听 
起 来 像 一 个 “ 硬 ” 指 标 ， 它 能 代表 一 种 简单 和 直观 的 概念 。 

尽管 它们 都 有 缺点 ， 但 时 钟 速度 、MIPS 和 FLOPS 在 比较 由 同一 供应 商 提供 的 一 系列 类 似 
计算 机 的 相对 性 能 时 都 是 有 用 的 指标 。 如 果 一 个 供应 商 答应 将 你 的 系统 从 目前 的 x MIPS 等 级 
升级 到 2x MIPS， 那 么 你 会 对 花 钱 得 到 性 能 改进 有 一 个 相当 好 的 想法 。 实 际 上 ， 很 多 制造 商 对 
这 种 单一 目标 都 有 自己 的 度量 指标 。 有 道德 的 销售 人 员 会 避免 使 用 他 们 公司 专 有 的 指标 来 描述 
竞争 对 手 的 系统 。 当 一 个 制造 商 的 专 有 指标 用 来 描述 竞争 对 手 的 系统 性 能 时 ， 潜 在 客户 无 法 知 
道 专 有 指标 是 否 已 人 为 设计 成 聚焦 于 某 一 特定 系统 类 型 的 长 处 ， 而 忽略 了 它 的 弱点 。 

显然 ， 依 赖 于 特定 系统 组 织 或 指令 集体 系 结构 的 任何 度量 指标 都 忽略 了 计算 机 购买 者 所 期 
望 的 目标 。 他 们 需要 一 些 客观 的 方法 来 了 解 哪个 系统 能 以 最 低 的 成 本 为 他 们 的 工作 负载 提供 最 
大 的 吞吐 量 。 


11. 4.2 综合 测试 基准 : Whetstone、Linpack 和 Dhrystone 


计算 机 研究 人 员 长 期 致力 于 定义 一 种 不 依赖 于 任何 系统 组 织 和 结构 的 基准 ， 并 且 用 它 能 够 
进行 公平 和 可 信赖 的 性 能 比较 。 这 种 对 理想 性 能 测试 的 正式 需求 始 于 20 世纪 80 年 代 后 期 。 当 
时 的 主流 思想 是 ， 通 过 标准 的 基准 测试 应 用 程序 可 以 独立 地 比较 不 同系 统 的 性 能 。 继 而 ， 可 以 
使 用 第 三 代 语 言 (如 C ) 编写 程序 ， 并 在 各 种 系统 上 编译 和 运行 它 ， 然 后 在 不 同 的 系统 上 测量 这 
个 程序 每 次 运行 所 需 的 时 间 。 由 此 产生 的 执行 时 间 将 产生 单一 性 能 指标 ， 它 适用 于 所 有 被 测 系 
统 。 以 这 种 方式 导出 的 性 能 度量 指标 称 为 综合 基准 ， 因 为 它们 不 必 代 表 任 何 特定 的 工作 负载 或 
应 用 程序 。3 个 最 广为人知 的 综合 基准 是 Whetstone 、Linpack 和 Dhrystone 度量 指标 。 

Whetstone 基准 测试 程序 是 由 哈 罗 德 * J. 克 芬 和 英国 国家 物理 实验 室 的 布 莱 恩 ' A. 威 尔 
曼 在 1976 发 布 的 。Whetstone 是 浮 点 密集 型 程序 ， 为 了 计算 三 角 孔 数 和 指数 函数 ， 它 需要 调用 
很 多 库 例 程 。 结 果 是 以 每 秒 百 万 KiloWhetstone 指令 或 每 秒 Mega- Whetstone 指令 进行 表示 的 。 

另 一 个 用 于 度量 浮 点 运算 性 能 指标 的 是 Linpack 基准 。Linpack 是 线性 代数 软件 包 的 缩写 ， 
是 一 个 名 为 基本 线性 代数 子 程序 ( BLAS ) 的 集合 ， 使 用 双 精 度 运算 求解 线性 方程 系统 。 阿 贡 国 
家 实验 室 的 Jack Dongarra 、Jim Bunch 、Cleve Moler 和 Pete Stewart 于 1984 年 开发 出 了 Linpack 基 
准 程序 ， 用 于 测量 超级 计算 机 的 性 能 。 它 最 初 是 用 FORTRAN 77 编写 的 ， 随 后 用 C 和 Java 重 写 
了 。 虽 然 它 有 一 些 严 重 的 缺点 ， 但 其 优点 是 在 于 它 为 FLOPS 设置 了 一 个 衡量 标准 。 一 个 根本 
没有 浮 点 运算 电路 的 系统 如 果 能 执行 Linpack 基准 程序 ， 那 么 就 能 够 获得 一 个 FLOPS 评级 。 

当然 ， 高 速 的 浮 点 运算 并 不 是 对 每 一 个 计算 机 用 户 都 是 很 重要 的 。 认 识 到 这 一 点 ， 西 门 子 
Nixdorf 信息 系统 的 Reinhold P. Weicker 在 1984 年 写 了 一 个 基准 程序 ， 该 程序 主要 进行 字符 串 处 
理 和 整数 运算 。 他 将 这 个 程序 称 为 Dhrystone 基准 ， 它 作为 Whetstone 基准 的 一 个 双关 语 。 这 


性 能 测量 和 分 析 421 





个 程序 是 CPU 密集 型 的 ， 没 有 实现 ZO 或 系统 调用 。 不 像 WIPS，Dhrystone 的 结果 以 每 秒 Dhry- 
stone 数 来 表示 (测试 程序 每 秒 内 能 够 执行 的 次 数 ) ， 而 不 是 以 DIPS 或 Mega- DIPS 来 表示 ! 

关于 它们 的 算法 和 报告 结果 ，Whetstone 、Linpack 和 Dhrystone 基准 都 有 着 简单 和 易于 理解 
的 优点 。 不 幸 的 是 ， 这 也 是 它们 的 主要 局 限 性 。 由 于 这 些 程序 的 操作 都 被 如 此 清晰 地 定义 了 ， 
所 以 对 编译 器 编写 者 来 说 ， 他 们 很 容易 用 “Whetstone”“Linpack” 和 “Dhrystone” 等 编译 开关 
来 配置 产品 。 在 设置 方式 时 ， 这 些 编译 选择 会 唤醒 由 这 种 基准 优化 过 的 特定 代码 。 而 且 ， 由 于 
编译 目标 很 小 以 至 于 大 部 分 程序 都 驻 留 在 当今 系统 的 缓存 里 。 这 样 基本 上 就 不 用 对 系统 存储 器 
管理 能 力 进 行 任何 评估 了 。 

设计 编译 器 和 系统 以 使 它们 在 执行 基准 程序 时 实现 优化 ， 这 是 一 个 和 综合 基准 指标 一 样 古 
老 的 实践 。 只 要 能 报告 出 好 的 数字 ， 就 会 有 经 济 优势 ， 制 造 商 将 会 尽 其 所 能 来 使 他 们 的 数字 看 
上 去 更 好 。 当 他 们 的 指标 值 比 竞争 对 手 更 好 一 点 时 ， 在 做 广告 时 就 会 大 肆 宣 传 具有 这 个 指标 的 
“高 级 ”系统 。 这 一 广泛 传播 的 实践 已 经 成 为 众所周知 的 基准 营销 。 当 然 ， 不 管 数字 多 么 好 
看 ， 基 准 测试 结果 告诉 我 们 的 唯一 一 件 事 就 是 被 测 系统 运行 基准 程序 有 多 好 ， 而 不 是 说 它 运 行 
任何 其 他 程序 有 多 好 一 一 尤其 是 你 的 特定 负载 。 


11. 4. 3 SPEC 基准 


计算 机 性 能 评价 科学 得 益 于 Whetstone 、Linpack 和 Dhrystone 基准 的 贡献 。 首 先 ， 这 些 程序 
让 所 有 系统 都 可 以 用 共同 标准 进行 比较 。 更 重要 的 是 ,尽管 不 是 故意 的 ， 但 在 他 们 声称 一 个 专 
门 设计 的 基准 测试 程序 小 而 简单 时 ， 制 造 商 可 以 很 容易 地 优化 其 产品 性 能 。 对 这 个 问题 ， 一 个 
显而易见 的 反应 是 设计 一 个 更 复杂 的 基准 测试 程序 并 使 其 能 产生 易于 理解 的 结果 。 这 是 SPEC 
CPU 基准 测试 程序 的 目标 。 

SPEC (标准 性 能 评价 机 构 ) 于 1988 年 由 一 些 计 算 机 制造 商 和 《电子 工程 时 代 》 期 刊 联合 成 
立 。SPEC 的 主要 目标 是 为 计算 机 性 能 测量 建立 可 配置 的 现实 方法 。 现 在 ， 这 个 团体 包含 了 60 
多 个 成 员 公司 和 3 个 组 织 委员 会 。 这 些 委 员 会 是 : 

e 开放 系统 组 (OSG)， 涉 及 工作 站 、 文 件 服务 器 和 桌面 计算 环境 。 

。 高 性 能 组 (HPG) ， 聚 焦 于 企业 级 的 多 处 理 器 系统 和 超级 计算 机 。 

e 图 形 和 工作 站 性 能 组 (GWPG) ， 主 要 致力 于 图 形 和 工作 站 基准 测试 的 开发 。 

这 些 组 织 与 计算 机 用 户 一 起 工作 来 识别 描述 典型 负载 的 应 用 程序 ， 或 是 那些 能 够 区 分 一 个 
高 级 系统 与 其 他 系统 的 应 用 程序 。 当 把 IYO 例 程 和 其 他 非 CPU 密集 型 的 代码 从 这 些 应 用 程序 
中 去 掉 后 ， 这 个 最 终 程序 称 为 一 个 核 。SPEC 委员 会 仔细 地 从 众多 团体 提交 的 应 用 程序 中 挑选 
出 核 程序 。 最 终 的 核 程序 集合 叫 作 基准 测试 集 。 

SPEC 基准 中 最 广为人知 的 是 它 的 CPU 测试 集 ， 它 可 以 测量 CPU 的 乔 吐 量 、 缓 存 和 存储 器 
的 访问 速度 以 及 编译 器 的 效率 。 这 个 基准 最 新 的 版 本 是 CPU2006。 它 包括 两 个 部 分 : 测量 一 个 
系统 执行 整数 处 理 好 坏 的 CINT2006 ， 以 及 测量 浮 点 运算 的 性 能 ( 见 表 11-7) 的 CFP2006。( CINT 
和 CFP 中 的 “C” 代 表 “ 组 件 ” 。 这 个 设计 强调 的 事实 是 基准 程序 仅 测试 系统 的 一 个 组 成 部 分 。) 











一 个 缩小 版 的 Perl v5. 8.7 脚本 语言 。 工 作 负载 
包括 一 些 第 三 方 的 模块 ， 如 SpamAssassin 、MHo- 
nArc( 邮件 索引 程序 ) 和 specdiff( SPEC 用 于 检查 基 
准 输出 的 工具 ) ， 它 们 都 作为 测试 的 一 部 分 头 执行 
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和 >: 逢 要 性 法 IE 和 E 琴 


Julian Seward 的 bzip2 版 本 1.0.3 修改 为 在 内 存 






















































































































. 人 0. 
401. bzip2 9650 他 压缩 中 进行 大 部 分 工作 ， 而 不 是 在 IJZ0 中 
a 站 C 编译 器 基于 gcc 的 3.2 版 ,为 AMD Opteron 处 理 器 生成 
代码 
429. mef 9120 |C 组 合 优化 车 辆 调度 。 使 用 网 络 单纯 形 算法 调度 公共 交通 
445. gobmk 10490 |C 人 工 智 能 : 围棋 玩 围棋 游戏 ， 一 个 使 用 简单 规则 的 复杂 游戏 
456. hmmer 9 330 & 查找 基因 序列 基于 隐 马 尔 可 夫 模 型 ( HMM ) 的 蛋白 质 序列 分 析 
458. sjeng 12100 |C 人 工 智能 : 象棋 一 种 包括 几 个 象棋 变 体 的 象棋 游戏 程序 
462. libquantum 20 720 C 物理 /量子 计算 人 运行 Shor 的 多 项 式 因 式 分 解 
H. 264/ 高 级 视频 编码 的 参考 实现 ， 采 用 2 参数 
464. h264ref 90 | 视频 压缩 设置 对 视频 济 编 到 
471. omnetpp 6250 | Gd+t+ 离散 事件 模拟 使 用 离散 事件 模拟 建 模 大 型 以 太 网 
i oo | ie 路 径 查 找 算法 使 用 A* 算 法 (包括 其 他 算法 ) 寻 找 二 维 地 图 上 
的 路 径 
本 XML 处 理 | “将 XML 文档 转换 为 其 他 文档 类 型 
410. bwaves 13 590 Fortran 流体 动力 学 ac 
416. gamess 19 580 | Fortran | 量子 化 学 Gamess 实现 广泛 的 量子 化 学 计算 
pe dig0 |C 物理 学 /量子 色 动力 学 为 带 有 动态 夸克 的 格 点 规范 理论 程序 生成 规范 
场 程序 
为 模拟 天 体 物 理 现 象 在 计算 天 体 物理 实验 室 开 
434. zeusmp 9 100 Fortran 物理 学 /CFD 发 的 计算 流体 力学 程序 (NCSA， 伊利 诺 伊 大 学 厄 
本 那 - 香槟 分 校 的 ) 
ee Re _，j x | ”分 子 动力 学 ， 即 模拟 牛顿 运动 方程 的 数 百 至 数 
435. gromacs 7140 1C Fort 生物 化 学 /分 子 动力 学 百 万 的 粒子 
436. cactusADM | 11950 | C，Fortran | 物理 学 /生成 现实 Shp engi SE 
计算 流体 动力 学 (CFD) 模 型 是 利用 大 涡 模 拟 和 
: pe 三 维 涡 模 型 建立 的 ， 它 是 用 来 研究 诸如 混合 、 燃 
eS11e. OFrtran 学 
ee sto 0 A 烧 、 声 学 和 一 般 流体 力学 等 一 系列 注 流 现象 的 主 
要 求解 工具 
pe &000 | Gt 生物 学 /分 子 动力 学 模拟 大 型 生物 分 子 系统 。 测 试用 例 有 92 224 个 
载 脂 蛋白 A -I 
a re 有 限 元 分 析 deal. i 是 一 个 针对 自 适 应 有 限 元 和 误差 估计 的 
C ++ 程序 库 
用 单纯 形 算 法 和 稀疏 线性 代数 求解 线性 程序 。 
. soplex 缘 
450. sop 8340 |C++ 线性 编程 ， 优 化 测试 用 例 包括 铁路 规划 和 军用 空运 模型 
Si 泻 染 一 个 1280x1024 抗 锯齿 的 棋盘 图 像 ， 并 且 在 
453. povray 5320 |C ++ 图 像 浑 染 和 光线 追踪 起 始 位 置 有 棋子 
454. calculix 8 250 | C，Fortran | 结构 力学 线性 和 非 线性 有 限 元 代码 的 三 维 结构 的 应 用 
459. GemsFDTD 10 610 | Fortran 计算 电磁 学 侈 用时 扰 有 限 莹 分 方法 (7 加) 下 甫 三 全 考 天 洒 
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测试 用 例 在 分 子 的 Hartree- Fock 波 函 数 计算 中 设 
5. tonto Fortrs 学 

st a) he Ci 置 了 一 个 约束 ， 以 匹配 实验 的 X 射线 衍射 数据 
470. lbm 13 740 Ic | 流体 动 力学 = 维 不 可 压缩 流体 的 模拟 
481. wrf 11 170 |C，Fortran | 气象 从 米 到 几 千 千 米 高 的 天 气 模拟 

源 自 卡 内 基 梅 隆 大 学 的 语音 识别 系统 ， 使 用 一 
482. sphinx3 19490 IC 语音 识别 个 名 为 Livepretend 的 程序 来 进行 批 处 理 模式 

下 的 解码 ， 但 操作 起 来 就 像 一 个 真人 声音 解码 





CINT2006 包含 12 个 应 用 程序 ， 其 中 9 个 用 C 语言 编写 , 还 有 3 个 用 C ++ 语言 编写 。 
CFP2006 测试 集 包 含 17 个 应 用 程序 ， 其 中 6 个 用 Fortran 语言 编写 ，3 个 用 C 语言 编写 , 4 个 用 
C ++ 语言 编写 ， 还 有 4 个 用 C 语言 和 Fortran 语言 共同 编写 。 运 行 这 些 程序 获取 的 结果 ( 系统 否 
吐 量 ) 用 时 间 比 例 来 表示 ， 即 测试 系统 运行 核 程序 和 参考 机 运行 相同 核 程序 的 时 间 之 比 。 对 
CPU2006 来 讲 ， 参 考 机 是 一 个 Sun Ultra Enterprise 2 工作 站 ， 它 有 296MHz 的 Ultra SPARC 2 处 
理 器 。 一 个 测试 系统 必 将 比 Sun Ultra 快 ， 因 此 你 能 期 望 看 到 销售 商 引用 的 大 的 正 数 ， 这 个 数值 
越 大 越 好 。 在 大 多 数 系统 上 完整 运行 整个 SPEC CPU2006 测试 集 需 要 48h。 报告 的 CINT2006 和 
CFP2006 结果 是 所 有 组 成 内 核 比率 的 几何 平均 。( 见 本 章 后 续 可 获取 更 多 细节 。) 

系统 销售 员 如 此 严重 地 依赖 于 良好 的 基准 测试 结果 ， 那么 人 们 可 能 会 认为 计算 机 制造 商 可 
以 尽 其 所 能 来 找到 为 运行 基准 程序 规避 SPEC 规则 的 方法 。 第 一 个 方法 就 是 使 用 编译 器 “基准 
开关 ”， 它 包括 传统 的 Whetstone 、Linpack 和 Dhrystone 程序 。 然 而 ， 找 到 完美 的 编译 选择 集 来 
和 SPEC 测试 集 一 起 使 用 不 是 像 使 用 早期 的 综合 基准 那么 简单 。 优 化 集合 中 的 每 一 个 核 程 序 通 
常 应 有 不 同 的 设置 ， 查 找 这 个 设置 是 一 项 费时 费力 的 工作 。 

在 CPU95 基准 测试 集 发 布 之 前 ，SPEC 意识 到 了 使 用 “基准 测试 专用 ”编译 器 选项 的 问 
题 。 它 试图 通过 要 求 基 准 测试 集中 使 用 相同 语言 编写 的 所 有 程序 必须 使 用 相同 的 编译 需 标 志 集 
进行 编译 来 解决 这 个 问题 。 这 一 要 求 立即 引起 了 供应 商界 的 批评 ， 他 们 认为 客户 有 权 了 解 系统 
所 能 达到 的 最 佳 性 能 。 而 且 ， 如 果 客 户 的 应 用 程序 与 其 中 一 个 核 程序 相似 ， 那 么 客户 可 通过 了 
解 最 佳 编译 器 选项 来 获得 更 大 收益 。 

允许 在 一 个 测试 集中 为 每 个 程序 使 用 不 同 的 编译 器 标志 的 论据 对 于 SPEC 来 说 是 非常 具有 
说 服 力 的 。 但 是 为 了 所 有 人 的 公平 ， 制 造 商 给 出 了 两 组 对 SPEC CPU2006 结果 。 一 组 用 于 所 有 
编译 器 的 设置 对 整个 测试 集 (基本 度量 ) 均 是 相同 的 测试 ， 第 二 组 给 出 通过 优化 设置 获得 的 结 
果 ( 峰 值 度量 ) 。 在 基准 测试 编译 中 这 两 个 数字 都 有 报告 ， 也 会 完整 公开 每 次 运行 编译 器 的 
设置 ， 

SPEC 基准 测试 的 用 户 为 安装 和 编译 该 测试 集 的 源 代 码 和 指令 支付 管理 费 。 鼓 励 制造 商 (但 
不 要 求 ) 提 交 一 份 报告 ， 其 中 包括 SPEC 基准 结果 以 供 审查 。 在 SPEC 确信 测试 是 和 其 指南 以 一 
致 的 方式 运行 之 后 ， 它 会 在 其 网 站 上 发 布 基准 测试 结果 和 配置 报告 。SPEC 的 监督 可 确保 制造 
商 正确 使 用 基准 软件 ， 并 完全 公开 了 系统 的 配置 。 

虽然 处 理 器 之 争 占据 了 很 多 计算 机 杂志 的 版 面 ， 但 阿 姆 达尔 定律 告诉 我 们 ， 一 个 有 用 的 系 
统 需要 的 不 仅 是 一 个 快速 的 CPU。 计算 机 购买 者 感 兴趣 的 是 整个 系统 在 特定 工作 负载 下 的 运行 
情况 到 底 如 何 。 为 此 ，SPEC 制定 了 一 系列 其 他 指标 ， 包 括 针 对 网 络 服务 器 的 SPEC Web， 针 对 
电力 与 性 能 的 SPEC Power 和 针对 客户 端 Java 性 能 的 SPEC JVM。SPEC JVM 是 由 针对 Java 服务 
右 性 能 的 SPEC JBB( Java 业务 基准 ) 来 补充 的 。 每 一 个 基准 都 遵循 建立 公平 和 客观 系统 性 能 度 





量 的 SPEC 理念 。 


11. 4.4 事务 处 理性 能 委员 会 基准 


SPEC 的 CPU 基准 对 于 那些 主要 关注 CPU 性 能 的 计算 机 购买 者 是 很 有 帮助 的 。 但 它们 对 企 
业 事 务 处 理 服务 器 的 购买 者 没有 那么 大 的 好 处 。 对 于 这 类 系统 ， 购 买 者 最 感 兴趣 的 是 服务 器 处 
理 大 量 并 发 短 时 行为 的 能 力 ， 其 中 每 个 事务 在 一 定 程度 上 都 涉及 通信 和 磁盘 IO。 

反应 缓慢 的 交易 处 理 系统 可 能 会 给 企业 带 来 巨大 的 开销 ， 造 成 深远 的 问题 。 当 顾客 服务 系 
统 很 慢 时 ， 一 长 串 脾气 暴躁 的 顾客 对 零售 店 的 形象 是 有 害 的 。 站 在 运行 缓慢 的 结账 柜台 前 的 客 
户 并 不 关心 信用 授权 系统 正在 陷入 困境 。 无 精 打 采 的 自动 柜员 机 和 反应 迟钝 的 售 货 点 的 售 货 系 
统 会 使 等 待 时 间 过 长 的 顾客 直接 离开 。 交 易 处 理 系 统 对 客户 服务 部 门 不 仅仅 是 重要 ， 那 是 他 们 
的 命脉 。 明 智 的 企业 领导 人 愿意 在 交易 处 理 系统 上 投入 一 笔 小 的 投资 以 保持 顾客 满意 。 有 这 人 么 
多 的 利害 关系 ， 所 以 必须 找到 一 些 客观 评估 支持 这 些 关 键 业 务 流 程 系统 的 总 体 性 能 的 方法 。 

计算 机 制造 商 总 有 办 法 测量 自己 系统 的 性 能 。 这 些 测量 方法 不 是 为 了 大 众 消费 ， 而 是 通过 
工程 师 找到 使 系统 (或 其 中 的 一 部 分 ) 表 现 得 更 好 的 方法 ， 来 供 企业 内 部 使 用 。 在 20 世纪 80 年 
代 早 期 ，IBM 公司 公布 了 一 个 基准 以 帮助 设计 其 大 型 机 系统 。 这 个 基准 就 是 TP1(TP 事务 处 
理 ) ,该 基准 最 终 进入 公共 领域 。 一 些 相互 竞争 的 供应 商 开始 使 用 它 并 宣布 他 们 (惊人 ) 的 结 
果 。 事 务 处 理 专家 对 这 种 做 法 持 批 评 态度 ， 因 为 基准 测试 的 设计 不 是 用 于 模拟 一 个 真实 事务 处 
理 环 境 的 。 一 方面 ， 它 忽略 了 网 络 延迟 和 有 用户“ 思考 时 间 ” 的 变化 。 换 名 话说， 所 有 TP1 能 
做 的 就 是 测量 理想 条 件 下 的 峰值 吞吐 量 。 虽 然 这 种 测量 对 系统 设计 者 很 有 用 ， 但 并 没有 给 计算 
机 购买 者 带 来 很 大 的 帮助 。 

1985 年 ， 对 TP1 一 直 颇 有 微 词 的 一 个 批评 家 Jim Gray 与 和 他 一 起 工作 的 一 大 群 同事 提出 了 
一 个 基准 以 解决 TP1 的 缺点 。 他 们 称 该 基准 为 借方 信任 ， 它 重点 关注 商业 事务 处 理性 能 。 除 了 
指定 该 基准 测试 如 何 工作 外 ，Gray 和 他 的 团队 还 建议 ， 系 统 测 试 的 结果 应 该 与 测试 的 系统 配置 
总 成 本 一 起 报告 出 来 。 他 们 提供 了 基准 可 以 按 比 例 缩放 的 方法 ， 以 使 测试 在 不 同 规模 的 系统 中 
保持 公平 。 


计算 SPEC CPU 基准 测试 

正如 我 们 在 文中 所 述 ， 计 算 SPEC 基准 测试 结果 的 第 一 步 是 将 参考 机 运行 基准 核 所 需 的 时 
间 规 范 化 到 测试 系统 在 运行 相同 核 程 序 时 所 需 的 时 间 。 内 核 运行 3 次， 使 用 中 值 运 行 时 间作 为 
计算 时 间 。 例如， 假设 一 个 假想 的 运行 401. bzip2 核 程 序 的 系统 分 别 用 了 907s、920s、928s 
中 间 值 是 920s。 参 考 机 花 了 9650s 来 运行 相同 的 程序 。 规 范 化 比值 为 9650 :920 =10.5( 舍 入 到 
小 数 点 后 一 位 )。 最 终 的 SPECint 结果 是 所 有 的 规范 化 比值 在 整数 程序 测试 集 的 几何 平均 。 考 
虑 表 11-8 所 示 的 结果 。 

表 11-8 假想 系统 执行 SPECInt2006 的 一 系列 结果 























基准 与 参考 时 间 之 比 
400. podbeaneh 9770 739 13.2 
401 bzip2 9 650 920 10.5 
40 gc | 8 050 814 9. 89 
429. mef | 9 120 1 16] 7. 86 
445: obik | 10 490 719 14.6 
456. hmmer | 9330 697 13.4 






































( 续 ) 
基准 参考 时 间 运行 时 间 与 参考 时 间 之 比 
458. sjeng 12 100 870 13.9 
462. libquantum | 20 720 1 342 15.4 
464. h264ref 22 130 995 22.2 
471. omnetpp 6 250 659 9. 49 
473. astar 7 020 732 9.59 
483. xalancbmk 6 900 820 8.42 











为 了 计算 几何 平均 ， 首 先 需要 求 出 12 个 规范 化 基准 测试 时 间 : 
13.2x 10.5 x9.89 x7.86 x14.6x13.4 
x 13.9 x 15.4 x 22.2 x9.49x9.59x8.42 =7.68 x 10" 
然后 ， 对 乘积 开 12 次 方 根 : 
(TO68 x O00) ss 11.8 

” 这样 ， 这 个 系统 的 CINT 度量 ( 令 人 印象 相当 深刻 的 ) 就 是 11.8。 如 果 这 个 结果 是 在 运行 基 
准 使 用 标准 编译 器 设置 编译 时 得 到 的 ， 那 么 它 将 报告 “基础 ”的 度量 为 SPECint_base_2006。 
否则， 它 是 就 本 系统 的 SPECint2006 评级 。 

当 每 次 只 运行 每 个 基准 的 一 个 映像 时 ，CINT 2006 和 CFP 2006 测试 集 测 量 一 个 CPU 性 能 。 
这 种 单线 程 模型 并 没有 告诉 我 们 系统 如 何 处 理 并 发 进程 。SPEC 的 CPU“ 速率 ”指标 给 了 我 们 
一 些 启 示 。 计 算 SPECint_rate 度量 比 计算 单线 程 的 SPECint 度量 更 复杂 一 点 。 

为 了 计算 速率 度量 ,主机 中 启动 了 许多 相同 的 基准 核 进 程 。 为 此 我 们 举例 说 明 ， 开 始 启动 
4 个 并 发 的 401. bzip2 进程 。 在 401. bzip2 中 所 有 的 例 程 终止 之 后 ， 利 用 最 后 一 个 例 程 的 结束 时 
间 减 去 第 一 个 例 程 的 开始 时 间 ， 我 们 求 出 执行 时 间 。 与 基本 度量 一 样 ， 重 复 这 个 过 程 3 次 ， 并 
使 用 这 些 计 算 结果 中 的 中 值 。 假 设 中 值 是 1049s。 然 后 ， 我 们 将 此 基准 的 参考 时 间 乘 以 重复 运 
行 次 数 ， 并 除 以 运行 的 中 值 。401. bzip2 基准 参考 时 间 就 是 9650s， 因 此 可 以 得 到 : 

4 x 9650 + 1049 ~ 36.8 

这 就 给 出 了 401. bzip2 基准 测试 在 单位 时 间 内 的 工作 效率 。 

本 系统 所 报告 的 SPECint_rate2006 指标 是 所 有 组 成 CINT2006 核 的 几何 平均 。 在 决定 SPECfp_ 
rate 结果 时 也 采用 相同 的 过 程 。 


DebitCredit 受到 了 供应 商 的 欢迎 ， 原 因 是 它 给 出 了 一 个 清晰 而 又 客观 的 性 能 评估 结果 。 不 
久 以 后 ， 大 多 数 供应 商都 开始 使 用 它 ， 并 轻率 地 宣布 他 们 的 好 结果 。 不 幸 的 是 ， 没 有 正式 的 机 
制 来 核实 或 驶 斥 他 们 的 主张 。 本 质 上 ， 制造 商 可 以 引用 任何 能 使 他 们 在 苋 争 中 占有 优势 的 结 
果 。 显 然 ， 迫 切 需要 一 些 独立 的 审查 和 控制 手段 。 为 此 ， 在 1988 年 ，Omri Serlin 说 服 了 8 个 计 
算 机 制造 商 联合 起 来 ， 形 成 了 独立 的 事务 处 理性 能 委员 会 (TPC)。 今天 ，TPC 由 大 约 30 个 公 
司 成 员 组 成 ， 包 括 系 统 软件 和 硬件 制造 商 。 

TPC 的 第 一 个 任务 是 发 布 一 个 带 有 官方 认 印 的 基准 测试 集 。 这 一 基准 在 1990 年 发 布 ， 称 
为 TPC-A。 紧 跟 技 术 创新 的 步伐 以 及 基准 测试 科学 的 进步 ，TPC-A 现在 是 第 三 次 修订 的 第 5 
版 ， 即 TPC-C 第 5 版 。 

TPC-C 基准 测试 集 对 批发 产品 经 销 公 司 的 活动 进行 建 模 。 测 试 集 是 5 种 事务 类 型 的 控制 组 
合 ， 其 中 这 些 类 型 是 典型 的 订单 履行 系统 。 这 些 事务 包括 新 订单 启动 、 库 存 级 别 查询 、 订 单 状 
态 查 询 、 货 物 交 付 过 账 和 付款 处 理 。 在 这 些 事 务 中 占有 资源 最 多 的 是 订单 启动 事务 ， 该 事务 至 
少 占 事务 组 合 的 45% 。 
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TPC-C 采用 远程 终端 仿真 软件 来 模拟 一 个 用 户 与 系统 的 交互 。 每 一 次 交互 都 是 通过 在 屏幕 
上 输入 格式 化 数据 进行 的 ， 这 个 屏幕 由 一 个 数据 录入 人 员 使 用 。 仿 真 程序 从 菜单 中 挑选 事务 ， 
就 像 一 个 真人 所 做 的 那样 。 然 而 ， 这 些 选 择 是 统计 随机 的 以 便 执 行 正 确 的 事务 组 合 。 输 入 值 
(比如 客户 姓名 和 零件 编号 ) ， 也 是 随机 的 ， 以 避免 数据 值 重复 缓存 命中 ， 从 而 强制 进行 频繁 
的 磁盘 1/0 操作 。 

TPC-C 的 端 到 端的 响应 时 间 是 指 从 “用 户 ” 已 完成 所 需 条 目的 时 刻 到 系统 在 终端 上 显示 所 
需 响 应 的 时 刻 。 在 最 新 的 TPC-C 规则 下 ， 除 了 库存 查询 ，90% 的 事务 必须 在 5s 内 准确 完成 。 
库存 查询 不 在 五 秒 规则 内 ， 因 为 在 单个 查询 事务 中 ， 库 存量 可 以 在 多 个 不 同 的 仓库 中 进行 检 
查 。 这 个 任务 比 其 他 任务 有 更 强 的 IO 密集 。 

记 住 ，TPC-C 测试 集 模拟 使 用 真实 系统 中 的 真实 业务 过 程 ， 每 一 个 更 新 事务 必须 支持 生产 
数据 库 中 的 一 个 ACID 属性 。( 这 些 性 质 在 第 8 章 已 描述 过 。)TPC-C 的 ACID 属性 包括 记录 锁定 
和 解锁 ， 以 及 由 数据 库 日 志文 件 记 录 更 新 提供 的 回 滚 能 

TPC-C 度量 是 指 在 同一 系统 上 同时 执行 其 他 交易 的 情况 下 ， 每 分 钟 新 订单 的 交易 完成 数 
(tpmC)。TPC-C 测试 结果 的 报告 还 包括 性 能 价格 比 ， 它 是 通过 系统 成 本 除 以 吞吐 量 指标 得 到 
的 。 因 此 ， 如 果 一 个 90 000 美元 的 系统 吞吐 量 是 15 000tpmC， 则 它 的 价格 性 能 比 就 是 6tpmC 美 
元 。 系 统 的 成 本 包括 所 有 的 硬件 、 软 件 以 及 执行 TPC-C 事务 处 理 所 需 要 的 网 络 组 件 。 测 试 中 使 
用 的 每 个 组 件 在 报告 结果 时 必须 是 可 以 向 公众 出 售 的 。 此 规则 旨 在 防止 使 用 基准 特殊 组 件 。 所 
有 包含 在 生成 报告 基准 测试 结果 的 系统 组 件 都 必须 列 在 (详细 地 ) 提交 给 TPC 的 完整 的 公开 报 
告 中 。 公 开 配 置 也 必须 包括 实际 测试 中 的 所 有 可 调 参数 ” ( 例如 ， 编 译 器 开关 ) 。 完 整 报告 中 还 
包括 “总 拥有 成 本 ”， 这 个 数字 要 考虑 到 3 年 的 维护 成 本 以 及 整个 系统 的 支持 成 本 。 

TPC 最 近 通 过 模拟 在 线 经 纪 的 TPC-E 基准 ， 改 进 了 (但 没有 取代 )TPC-C 基准 。 这 个 新 的 
基准 测试 的 目的 是 尽 可 能 地 反映 真实 情况 ， 它 是 一 个 现代 OLTP 系统 的 配置 。 该 基准 使 用 虚构 
的 在 线 经 纪 ， 它 可 以 管理 客户 账户 ， 并 代表 这 些 客户 进行 股票 交易 。 数 据 表 预 装 了 来 自 美国 和 
加 拿 大 的 真实 的 人 口 普查 数据 ,以 及 美国 纽约 证 券 交 易 所 和 纳 斯 达 克 证 券 交 易 所 的 人 口 数据 。 
工作 负载 可 以 根据 测试 系统 的 “客户 ”数量 而 变化 。 由 此 产生 的 指标 是 每 秒 完成 交易 次 数 
(tpsE) 、 每 tpsE 的 性 能 价格 美元 ( $/tpsE) 以 及 每 tpsE 的 瓦特 (电力 消耗 数 (Watts/tpsE )。 
与 所 有 其 他 的 TPC 基准 一 样 ，TPC-E 的 结果 受 严格 的 审计 和 真实 报告 的 管制 。 

当 一 个 供应 商 向 TPC 提交 其 TPC-C 和 TPC-E 结果 时 ， 报 告 中 的 所 有 信息 都 应 由 独立 的 审 
计 事 务 所 审计 以 确保 其 完整 性 和 准确 性 。( 当然 ， 审 核 员 不 能 重新 运行 测试 ， 所 以 如 果 测 试 能 
正确 执行 ,吞吐 量 数据 通常 是 用 报告 指标 来 计算 的 。) 一 旦 报告 被 TPC 所 接受 ,那么 它们 就 公 
布 在 网 上 以 供 客户 和 竞争 对 手 检验 。 有 时 ， 竞 争 对 手 或 TPC 本 身 会 挑战 制造 商 的 结果 。 在 这 种 
情况 下 ， 制 造 商 可 以 撤回 或 捍卫 其 报告 。 有 了 时， 报告 会 悄悄 撤回 ， 因 为 捍卫 这 个 结果 的 成 本 是 
令 人 望而却步 的 ， 即 使 制造 商 在 其 索赔 中 有 充分 的 理由 。 由 于 测试 的 配置 不 再 可 用 ， 或 者 系统 
的 下 一 个 模型 比 旧 模型 有 了 较 大 改动 时 ， 所 以 供应 商 也 可 以 选择 撤回 其 结果 。 

TPC-C 和 TPC-E 只 是 由 事务 处 理 委员 会 提出 的 两 个 基准 。 当 TPC 成 立时 ， 商 业 计 算 界 主 
要 包括 事务 处 理 系 统 ， 这 些 系统 也 支持 记 账 和 工资 等 财务 过 程 。 这 些 系 统 采用 了 明确 定义 的 输 
入 集 ， 并 产生 了 明确 定义 的 输出 。 通 常 以 打印 报表 和 表单 的 形式 进行 输出 。 这 种 确定 性 模型 缺 
乏 在 当今 业务 环境 中 提供 深层 数据 分 析 工 具 时 所 需 的 灵活 性 。 很 多 公司 已 经 用 决策 支持 工具 代 
蔡 了 他 们 的 静态 报表 。 这 些 应 用 程序 访问 大 量 的 输入 数据 以 产生 用 于 营销 指南 和 商务 物流 的 业 








加 ”完整 披露 报告 中 提供 的 可 调 信息 是 系统 管理 员 寻 求 优化 系统 性 能 的 一 种 宝贵 资源 ， 它 类 似 于 由 TPC-C 测试 
报告 。 因 为 真正 的 工作 负载 并 不 是 和 TPC-C 测试 集 完 全 相同 的 ， 所 以 报告 中 的 可 调 信息 可 能 不 会 提供 最 佳 
的 结果 ， 但 它 往往 是 一 个 很 好 的 出 发 点 ， 
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务 智 能 信息 。 从 某 种 意义 上 说 ， 决 策 支持 应 用 程序 与 事务 处 理应 用 程序 完全 相反 。 它 们 需要 不 
同 种 类 的 计算 机 系统 。 事 务 处 理 环境 处 理 大 量 的 短 时 进程 ， 决 策 支 持 系 统 处 理 少量 的 长 时 
进程 。 

谁 也 不 能 期 望 决策 支持 系统 在 进行 简单 的 在 线 订 单 状 态 查询 时 ， 会 瞬时 产生 结果 。 然 而 ， 
一 个 人 愿意 等 待 的 时 间 是 有 限 的 ， 不 管 最 终结 果 是 否 有 用 。 事 实 上 ， 如 果 一 个 决策 支持 系统 
“ 太 慢 ”， 那 么 管理 人 员 就 不 愿意 使 用 这 种 系统 ， 从 而 也 就 不 会 达到 这 种 系统 的 目标 。 因 此 ， 
即使 在 我 们 愿意 等 待 一 段 时 间 以 得 到 答案 的 情况 下 ， 性 能 也 依然 是 个 问题 。 


TPC 基准 测试 : 一 个 现实 的 检验 





事务 处 理性 能 委员 会 进行 了 种 种 尝试 ， 他 们 利用 TPC-C、TPC-H 和 TPC-R 基准 来 对 真实 场 
景 进 行 建 模 。 为 确保 基准 包含 普遍 的 商业 事务 和 活动 的 真实 组 合 ， 它 付出 了 巨大 的 努力 。 这 些 
活动 是 随机 生成 的 以 便 产生 尽 可 能 多 的 IO 活动 。 具 体 地 说 ， 数 据 应 该 经 常 从 磁盘 上 获取 ， 而 
不 是 从 缓存 或 其 他 快 存 中 获取 。 

背后 的 想法 是 测试 不 应 该 偏向 于 某 一 特定 类 型 的 架构 。 如 果 数 据 不 是 随机 产生 的 ， 那 么 基 
准将 对 那些 有 大 型 缓冲 存储 器 的 系统 有 利 ， 而 在 实际 环境 中 不 可 能 完全 拥有 这 样 的 系统 。 

多 年 来 ， 这 个 想法 直到 在 IBM 实习 的 博士 生 Windsor W. Hsu 进行 了 一 系列 的 实证 研究 后 才 
遇 到 了 挑战 。 在 IBM 的 阿尔 马 登 研究 中 心 的 主持 下 ，Hsu 和 他 的 同事 们 监视 了 百 万 计 的 事务 ， 
这 些 事 务 所 在 的 系统 由 数 十 个 IBM 的 大 客户 所 拥有 。Hsu 的 工作 验证 了 'TPC 基准 测试 的 许多 方 
面 ， 包 括 它 们 的 工作 负载 。 然 而 ，Hsu 发 现 现 实 世界 的 活动 与 TPC 模型 有 两 个 方面 的 不 同 

首先 ，TPC 基准 测试 表现 出 持续 且 恒 定 的 事务 速率 。 他 们 这 样 设计 的 目的 就 是 为 了 在 峰值 
工作 负载 率 下 充分 给 系统 加 压 。 

但 是 Hsu 发 现 真 正 的 工作 负载 是 具有 突 发 性 的 。 一 系列 活动 发 生 后 ， 在 下 一 个 活动 爆发 之 
前 会 有 一 个 平静 期 。 这 对 设计 者 意味 着 ， 如 果 将 有 效 的 动态 资源 分 配 设施 纳入 到 系统 软件 和 硬 
件 中 ， 那 么 整体 性 能 就 可 以 提高 。 虽 然 许多 制造 商 实 际 上 在 使 用 动态 资源 分 配 ， 但 他 们 的 努力 
在 TPC 基准 测试 中 没有 得 到 回报 。 

Hsu 的 第 二 个 主要 结果 挑战 了 TPC 基准 测试 中 的 随机 数据 和 工作 负载 的 概念 。 他 发 现 ， 真 
正 的 系统 比 TPC 程序 表现 出 了 更 明显 的 “ 伪 顺 序 性 ”。 这 一 发 现 很 重要 ， 因 为 许多 系统 从 磁极 
和 内 存 中 预 取 数据 。 当 使 用 预 取 时 ， 实 际 工作 负载 从 中 受益 很 多 。 而 且 ， 数 据 访问 模式 本 身 的 
伪 顺 序 性 非常 适用 于 最 近 最 少 使 用 (LRU) 缓 存 和 内 存 页 面 蔡 换 策略 。 而 TPC 基准 则 没有 这 一 
特点 。 

Hsu 的 工作 并 不 是 反对 TPC 基准 。 相 反 ， 它 放大 了 一 个 愚蠢 的 想法 ， 这 个 想法 认为 可 以 将 
基准 结果 扩展 到 特定 真实 情况 中 。 虽 然 TPC 基准 并 不 像 某 些 人 所 希望 的 那样 模拟 真实 世界 ， 但 
在 比较 不 同系 统 体系 结构 的 性 能 时 ,它们 仍然 是 一 个 诚实 且 相 当 公 正 的 标准 。 


针对 这 一 较 新 的 计算 领域 ，TPC 提出 了 两 个 基准 (TPC-H 和 TPC-R) 来 描述 决策 支持 系统 
的 性 能 。 虽 然 这 些 标准 都 是 针对 决策 支持 系统 的 ， 但 当 报 告 系统 的 参数 已 知 时 (对 报告 来 说 ， 
数据 库 可 以 索引 和 优化 ) ， 用 TPC-R 基准 测试 性 能 。TPC-H 基准 测试 一 个 系统 如 何 能 产生 特 设 
的 查询 结果 ， 这 里 查询 的 参数 不 是 已 知 的 。TPC- 互 测试 结果 用 每 小 时 给 定 的 查询 ( QphH ) 来 表 
示 ， 而 TPC-R 用 QphR 来 表示 。TPC 把 这 些 结果 根据 查询 运行 的 数据 库 大 小 来 进行 分 类 ， 因 为 
对 100GB 数据 的 查询 和 对 1TB 数据 的 查询 是 完全 不 同 的 任务 。 

在 选择 满足 企业 计算 需求 方面 的 系统 时 ，TPC 基准 是 值得 信赖 的 。 使 用 这 些 度量 的 主要 和 缺 
陷 是 假设 基准 在 任何 特定 的 工作 负载 下 都 可 准确 地 预测 出 系统 的 性 能 。 这 不 是 TPC 的 主张 或 意 





图 。 研 究 表 明 ， 一 组 实际 工作 负载 与 TPC 工作 负载 不 同 。 若 使 用 正确 ， 计 算 机 基准 是 不 可 或 缺 
的 工具 。 若 使 用 不 当 ， 它 就 会 把 我 们 带 偏 。 


11.4.5 系统 仿真 

TPC 基准 测试 与 SPEC 基准 测试 的 区 别 在 于 ， 它 会 尽量 模拟 完整 的 计算 环境 。 虽 然 TPC 基 
准 测试 的 目的 是 测量 性 能 ， 但 它 的 仿真 环境 有 助 于 预测 和 优化 各 种 条 件 下 的 性 能 。 一 般 来 说 ， 
仿真 给 了 我 们 工具 ， 我 们 可 以 用 此 工具 来 建 模 并 预测 系统 行为 的 各 个 方面 ， 而 不 必 使 用 仿真 程 
序 建 模 的 精确 的 现场 环境 。 

在 估计 那些 还 不 存在 的 系统 性 能 和 系统 配置 时 ， 仿 真是 非常 有 用 的 。 思 考 周 全 的 系统 设计 
者 总 是 在 构建 产品 的 商业 版 本 之 前 对 新 的 硬件 和 软件 进行 仿真 研究 。1967 年 ， 斯 坦 福 大 学 的 
博士 生 Norman R. Nielson 在 他 的 论文 《通用 计算 机 分 时 系统 的 分 析 》 中 引 人 注 目地 表现 出 了 这 种 
方法 的 智慧 之 处 。Nielson 的 论文 记录 了 他 对 IBM 尚未 公布 的 360/67 分 时 系统 (TSS ) 的 仿真 研 
究 。 使 用 IBM 发 布 的 规范 ，Nielson 的 工作 揭示 了 在 360/67 TSS 中 存在 严重 的 缺陷 。 他 的 发 现 
促使 IBM 在 广泛 发 布 新 产品 之 前 要 先 提高 系统 的 设计 。 

仿真 是 完整 系统 中 特定 方面 的 模型 。 它 们 给 系统 设计 者 提供 了 一 种 在 受 控 环 境 中 进行 
“what ”测试 的 优势 ， 而 这 种 控制 环境 与 实用 系统 是 分 离 的 。 假 设 你 对 系统 能 承受 的 最 大 限 
度 的 并 发 任务 数量 感 兴趣 。 可 调 参数 包括 每 个 任务 的 主 存 分 配 和 它 占 用 的 CPU 时 间 片 。 根 据 
已 知 的 每 一 个 任务 的 特点 ， 直 到 找到 一 个 最 优 平 衡 时 才 调 整 参 数 。 在 有 真实 任务 和 真正 用 户 存 
在 的 真实 环境 中 ， 这 样 的 调 参 方式 会 引起 真正 的 风险 ， 最 坏 的 情况 可 能 就 是 没有 人 能 完成 任何 
Es 

系统 仿真 的 一 个 主要 挑战 就 是 确定 工作 负载 的 特点 。 工 作 负 载 模型 应 该 与 建 模 的 系统 组 件 
相符 。 一 种 方法 是 通过 检查 系统 日 志 来 获得 一 个 综合 的 并 在 统计 上 是 合理 的 工作 负载 概要 文 
件 。 这 是 TPC 在 为 TPC-W 基准 产生 工作 负载 模型 时 使 用 的 方法 。 

如 果 仿 真 程 序 只 关注 系统 的 一 个 部 件 ， 那 么 捕获 整个 系统 或 整个 工作 负载 的 行为 将 不 能 产 
生 足 够 多 的 数据 粒度 。 例 如 ， 系 统 设 计 人 员 试 图 确定 一 个 理想 的 组 相 联 存储 器 缓存 的 配置 。 这 
种 配置 包括 一 级 和 二 级 缓存 的 大 小 ， 以 及 每 个 缓存 块 的 组 大 小 。 在 对 这 种 类 型 进行 仿真 时 ， 仿 
真 程序 需要 详细 的 内 存 访 问 数据 。 这 类 信息 通常 来 源 于 系统 跟踪 。 

系统 跟踪 通过 使 用 硬件 或 软件 监视 感 兴趣 部 件 的 活动 来 收集 详细 的 行为 信息 。 调 查 跟踪 部 
件 实际 行为 的 每 个 细节 ， 可 能 包括 二 进 制 指令 和 内 存 引 用 。 因 为 数据 集 的 输出 非常 大 ， 所 以 跟 
踪 程 序 只 能 包含 几 秒 钟 的 系统 活动 。 在 产生 有 统计 意义 的 模型 时 ， 需 要 多 次 跟踪 。 

当 设 计 仿 真 程序 时 ， 必 须 清 晰 定义 仿真 程序 的 用 途 。 需 要 良好 的 工程 评价 来 区 分 重要 和 不 
重要 的 系统 特性 。 过 于 详细 的 模型 成 本 高 ， 并 需要 花费 大 量 的 时 间 来 编写 。 相 反 ， 若 仿真 程序 
过 于 简单 ， 则 会 导致 忽视 关键 因素 而 产生 误导 性 的 结果 。 系 统 仿 真是 一 个 非常 好 的 工具 ,但 是 
像 任何 工具 一 样 ， 我 们 必须 确保 它 是 适合 该 项 任务 的 。 系 统 仿真 器 必须 经 过 验证 以 确认 模型 所 
建立 的 假设 。 最 简单 的 模型 是 最 容易 验证 的 。 


11.5 CPU 性 能 优化 


CPU 性 能 一 直 是 系统 优化 的 主要 焦点 。 因 为 CPU 春 吐 量 受到 多 种 因素 的 影响 ， 所 以 没有 
单一 的 方法 来 提高 CPU 性 能 。 例 如 ， 程 序 代码 影响 指令 条 数 ， 编译 器 既 影响 指令 数 也 影响 每 
条 指令 所 需 的 平均 时 钟 周期 ，ISA 决定 指令 条 数 和 每 条 指令 所 需 的 平均 时 钟 周期 ;而 实际 硬件 
组 织 则 确定 每 条 指令 所 需 的 时 钟 周期 和 时 钟 周期 的 长 度 。 

潜在 的 CPU 优化 技术 包括 集成 浮 点 单元 、 并 行 执行 单元 、 专 用 指令 、 指 令 流水 线 、 分 支 
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预测 和 代码 优化 。 除 了 最 后 两 项 ， 其 余 内 容 都 已 经 在 前 面 的 章节 中 讨论 过 ， 所 以 我 们 把 注意 力 
放 在 分 支 预 测 和 优化 用 户 代码 上 。 


11:551 .分支 优化 


现在 ， 对 取 指 - 译 码 - 执行 指令 周期 应 该 非常 熟 秋 了。 指令 流水 线 对 性 能 有 很 大 的 影响 ， 
已 纳入 到 大 多 数 当代 体系 结构 中 。 但 是 ， 在 流水 线 中 分 支 带 来 了 惩罚 。 考 虑 一 个 条 件 分 支 的 运 
行情 况 ， 在 当前 指令 执行 完成 的 时 候 才 能 知道 下 一 条 指令 的 地 址 。 这 迫使 流水 线 中 的 指令 流 延 
迟 ， 因 为 处 理 器 在 完成 分 支 指令 时 才能 知道 下 一 条 指令 。 事 实 上 ， 流水线 越 长 ( 它 所 拥有 的 阶 
段 越 多 ) ， 在 它 知道 接 下 来 要 取 哪 条 指令 之 前 ， 流 水 线 等 待 的 时 间 就 越 长 。 

现代 处 理 器 的 流水 线 越 来 越 长 。 通 常 ，20% ~ 30% 的 机 器 指令 都 包含 分 支 ， 研究 表明 大 约 
有 65% 的 分 支 会 发 生 。 此 外 ， 在 两 个 分 支 之 间 大 约 平均 有 五 条 指令 ， 这 会 迫使 许多 流水 线 阻 
塞 ， 从 而 产生 了 对 减少 分 支 所 佛 来 惩罚 的 需求 。 造 成 流水 线 墙 塞 的 因素 称 为 冒险 。 它 们 包括 数 
据 依赖 、 资 源 冲 突 和 从 内 存 中 取 指 的 访问 延迟 等 。 除 了 在 检测 到 冒险 时 停止 流水 线 的 运行 ， 几 
乎 无 计 可 施 。 但 是 ， 分 支 优化 是 在 可 控 范 围 内 的 。 由 于 这 个 原因 ， 分 支 预测 成 为 了 改善 CPU 
性 能 的 焦点 。 

延迟 分 支 是 处 理 分 支 对 流水 线 影响 的 一 种 方法 。 例 如 ， 在 执行 条 件 分 支 时 ， 执 行 分 支 之 后 
的 一 个 或 多 个 指令 ， 而 不 管 分 支 的 输出 结果 如 何 。 这 个 想法 是 利用 了 分 支 后 边 浪 费 的 周期 。 这 
是 通过 在 分 支 后 面 插入 一 条 指令 ， 然 后 在 分 支 发 生 之 前 来 完成 这 一 过 程 的 。 实 际 的 结果 是 在 分 
支 生效 之 前 执行 紧 跟 分 支 的 指令 。 

最 好 用 一 个 例子 来 解释 这 个 概念 。 考 虑 下 面 的 程序 : 


Add Rl R2. RS 
Branch Loop 
Div R4, R5, R6 


Loop: Mult 

这 将 导致 对 取 指 (F) 、 译 码 (D) 和 执行 (E) 流 水 线 的 跟踪 : 
时 间 槽 : 1 2 3 4 5 6 
Add F D E 
Branch F D E 
Div E | 
Mult F D E 


除法 指令 给 出 了 一 个 浪费 的 指令 模 ， 因 为 这 条 指令 虽然 被 取出 来 了 ,但 是 由 于 分 支 的 关系 
它 没有 被 译 码 也 未 执行 。 通 过 颠倒 分 支 指 令 和 男 一 条 无 论 如 何 都 会 执行 的 指令 顺序 执行 ， 这 个 
时 间 权 可 以 由 男 一 条 指令 填充 : 


时 间 槽 ， 1 2 3 4 5 6 
Branch F D E 

Add , 3 D E 

Mult F D E 


应 该 明确 的 是 ， 尽 管 延 迟 分 支 使 用 了 浪费 的 分 支 延迟 槽 ， 但 延迟 分 支 实际 上 重 排 了 指令 的 
执行 顺序 。 因 此 ， 编 译 器 必须 执行 数据 依赖 性 分 析 ， 以 确定 延迟 分 支 是 否 可 能 存在 。 可 能 出 现 
的 问题 是 没有 指令 可 以 移动 到 分 支 之 后 (进入 延迟 槽 ) 。 在 这 种 情况 下 ， 一 条 NOP(“ 空 操作 ” 
指令 ， 不 执行 任何 操作 ) 放 置 在 分 支 之 后 。 显 然 ， 在 这 种 情况 下 ， 分支 惩 罚 与 不 使 用 延迟 分 支 





是 相同 的 。 

编译 器 可 以 通过 多 种 方式 选择 放置 在 延迟 槽 中 的 指令 。 第 一 个 选择 是 执行 一 条 不 管 分 支 是 
否 发 生 都 会 执行 的 指令 。 主 要 候选 指令 是 分 支 语 句 之 前 的 指令 。 其 他 可 能 性 包括 分 支 发 生 时 要 
执行 的 指令 ， 但 分 支 不 发 生 也 无 害 。 相 反 的 方法 也 在 考虑 之 中 : 假设 分 支 不 发 生 ， 但 分 支 发 生 
时 也 不 会 造成 伤害 ， 则 执行 该 语句 。 候 选 指令 也 包括 那些 不 管 这 个 分 支 是 否 发 生 都 不 会 造成 伤 
害 的 语句 。 延 迟 分 支 具 有 硬件 成 本 低 的 优点 ， 并 且 依 赖 于 编译 器 来 填充 延迟 槽 。 

将 分 支 惩罚 最 小 化 的 另 一 种 方法 是 分 支 预测 。 分 支 预测 是 试图 猜测 指令 流 中 下 一 条 指令 的 
进程 ， 以 此 避免 由 分 支 而 导致 的 流水 线 阻 塞 。 如 果 预 测 成 功 ， 则 流水 线 中 不 会 引入 延迟 。 如 果 
预测 不 成 功 ， 必 须 清洗 流水 线 ， 并 且 要 放弃 所 有 由 错误 计算 带 来 的 计算 。 分 支 预测 技术 取决 于 
分 支 特性 : 循环 控制 分 支 、if/then/else 分 支 、 子 程序 分 支 。 

为 了 充分 利用 分 支 预测 ， 流 水 线 必须 保持 充满 。 因 此 ， 一 旦 进行 了 预测 ， 就 会 开始 取 指 令 
并 执行 。 这 叫 作 推 测 执行 。 这 些 指令 在 确认 是 否 需要 执行 之 前 就 被 执行 了 。 如 果 发 现 预测 不 正 
确 ， 则 必须 取消 之 前 的 操作 。 

分 支 预测 就 像 一 个 黑 盒 ， 我 们 向 它 提供 各 种 输入 数据 ， 并 得 到 一 个 预测 的 目标 指令 作为 输 
出 。 当 被 测 代 码 简单 地 输入 这 个 黑 盒 时 ， 这 就 是 静态 预测 。 如 果 除 了 代码 ， 我 们 还 输入 了 状态 
历史 (以 前 关于 分 支 指令 及 其 结果 的 信息 ) ， 黑 盒 使 用 的 就 是 动态 预测 。 固 定 预测 是 不 论 分 支 
是 否 会 发 生 ， 在 每 次 遇 到 分 支 时 ， 预 测 都 是 一 样 的 。 真 正 的 预测 有 两 个 可 能 的 结果 ， 要 么 “ 执 
行 分 支 " ， 要 么 “不 执行 分 支 。 

在 固定 预测 中 ， 当 没有 分 支 时 ， 其 思想 是 假定 分 支 不 会 发 生 ， 然 后 继续 顺序 执行 指令 。 但 
是 ， 如 果 分 支 发 生 了 ， 则 处 理 是 并 行 执 行 的 。 如 果 预 测 正 确 ， 则 删除 预 处 理 信息 并 继续 执行 指 
令 。 如 果 预 测 不 正确 ， 则 删除 推测 处 理 的 结果 ， 并 使 用 预 处 理 信息 继续 在 正确 的 路 径 上 执行 。 

在 固定 预测 中 ， 假 设 分 支 总 是 执行 时 ， 对 不 正确 的 预测 也 有 了 准备 。 在 推测 处 理 开 始 之 前 
先 保存 状态 信息 。 如 果 猜 测 正确 ， 则 删除 这 些 保存 的 信息 。 如 果 预 测 不 正确 ， 则 删除 推测 处 理 
的 结果 ， 并 使 用 保存 的 状态 信息 恢复 执行 环境 ， 此 时 将 执行 合适 的 路 径 。 

动态 预测 通过 使 用 以 前 分 支 记录 的 历史 来 提高 分 支 预 测 的 准确 性 。 然 后 这 些 信息 连同 代码 
一 起 送 入 分 支 预测 器 ( 黑 盒 ) 。 用 于 分 支 预测 的 主要 部 件 是 分 支 预测 缓冲 器 。 这 个 高 速 的 缓冲 
器 由 分 支 指令 地 址 的 低位 进行 索引 ， 并 利用 附加 位 指示 该 分 支 最 近 是 否 发 生 过 。 分 支 预测 缓冲 
器 总 是 返回 一 个 以 几 个 二 进 制 位 表示 的 预测 。 一 位 动态 预测 采用 单一 个 二 进 制 位 记录 最 后 一 次 
出 现 的 分 支 是 否 发 生 了 。 两 位 预测 保留 给 定 分 支 指 令 前 两 次 的 执行 历史 。 附 加 位 有 助 于 减少 循 
环 末 尾 的 预测 失误 ( 当 循 环 退 出 时 ,不 再 像 以 前 那样 执行 分 支 )。 两 种 分 支 预 测 位 可 以 有 多 种 
方式 表示 状态 信息 。 例 如 ， 四 种 可 能 的 二 进 制 位 组 合 模 式 可 以 指示 分 支 发 生 的 历史 概率 (11: 
强 发 生 ; 10: 弱 发 生 ; 01: 弱 未 发 生 ; 00: 强 未 发 生 ) 。 仅 当 错 误 预 测 发 生 两 次 时 ， 概 率 才 会 
改变 。 

分 支 预测 的 早期 实现 几乎 完全 是 静态 的 。 大 多 数 最 新 的 处 理 髓 (包括 Pentium、PowerPC、 
UltraSPARC 和 摩托 罗拉 68060 ) 使 用 两 位 动态 分 支 预测 ， 它 有 更 高 的 精度 和 更 少 的 预测 失误 
在 一 些 超 标量 处 理 器 中 就 使 用 了 两 位 动态 分 支 预测 ， 而 在 另 一 些 中 则 将 其 作为 一 个 选项 。 许 多 
系统 将 分 支 预测 处 理 放 到 专用 电路 上 ， 它 可 以 产生 更 及 时 准确 的 预测 。 


程序 优化 的 技巧 
e 给 编译 器 尽 可 能 多 的 你 要 做 什么 的 信息 ， 尽 可 能 使 用 常量 和 局 部 变量 。 如 果 编 程 语言 允 
许 ， 请 定义 原型 并 声明 静态 函数 。 需 要 时 尽量 使 用 数组 而 不 是 指针 。 
e 避免 不 必要 的 类 型 转换 并 减少 浮 点 数 到 整数 的 转换 。 
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避免 洪 出 和 下 溢 。 

使 用 合适 的 数据 类 型 (比如 float，double，int)。 

考虑 使 用 乘法 而 不 是 除法 。 

删除 所 有 不 必要 的 分 支 。 

尽 可 能 使 用 迭代 而 不 是 递归 。 

构建 条 件 语句 ( 比如 if，switch，case) 时 把 最 有 可 能 发 生 的 情况 放 在 最 前 面 。 

按 从 大 到 小 的 顺序 声明 结构 体 中 的 变量 。 

当 程序 性 能 有 问题 时 ， 在 开始 优化 程序 之 前 对 程序 进行 概要 剖析 。( 齐 析 是 将 代码 分 解 
成 小 模块 并 记录 这 些 模块 执行 时 间 的 过 程 ， 以 此 确定 哪些 代码 占用 的 时 间 最 多 。) 

永远 不 要 抛弃 仅 基 于 原 有 性 能 创建 的 算法 。 只 有 在 所 有 算法 都 充分 优化 后 才能 进行 公平 
的 比较 。 


11. 5.2 使 用 好 的 算法 和 简单 代码 


世界 上 最 好 的 处 理 器 硬件 和 优化 编译 器 只 能 使 程序 运行 更 快 ， 它 们 永远 也 不 会 和 掌握 了 有 
效 算 法 和 编码 设计 学 的 人 相同 。 回 顾 第 6 章 的 访问 数组 行 优先 与 列 优先 的 示例 可 知 ， 它 的 基本 
思想 是 ， 将 数据 访问 与 存储 方式 匹配 得 更 紧密 可 以 提高 性 能 。 如 果 一 个 数组 是 行 优先 存储 的 ， 
但 却 以 列 优先 的 顺序 访问 它 ， 那 么 会 削弱 局 部 性 原则 ， 从 而 导致 性 能 下 降 。 虽 然 编译 器 可 以 在 
一 定 程度 上 提高 性 能 ， 但 它们 的 范围 主要 局 限于 底层 代码 优化 。 程 序 代码 可 以 对 性 能 的 各 个 方 
面 产生 巨大 影响 ， 从 流水 线 到 内 存 到 AO。 本 节 专 门 介绍 ， 程 序 员 可 以 利用 哪些 机 制 使 计算 机 
获得 最 佳 性 能 。 

操作 计数 是 提高 程序 性 能 的 一 种 方法 。 使 用 这 种 方法 可 以 估计 在 循环 中 执行 的 指令 类 型 的 
数目 ， 确 定 每 个 指令 类 型 所 需 的 机 器 周期 数 。 然 后 可 以 使 用 这 些 信息 来 实现 更 好 的 指令 平衡 。 
这 样 做 的 目的 是 尝试 为 给 定 的 体系 结构 (如 取 、 存 、 整 型 操作 、 浮 点 操作 、 系 统 调用 ) 用 最 佳 
的 指令 组 合 来 写 循环 。 记 住 ， 对 一 个 硬件 平台 来 说 是 好 的 指令 组 合 ， 对 于 男 一 个 不 同 的 平台 可 
能 并 不 是 好 的 组 合 。 

循环 广泛 应 用 于 程序 中 ,并 且 是 程序 优化 的 极 佳 选 择 。 特 别 是 ， 肉 套 循环 提供 了 许多 有 趣 
的 优化 机 会 。 通 过 一 些 调查 可 以 改善 存储 器 访问 模式 并 提高 指令 级 并 行 性 。 循 环 展开 是 易于 任 
何 程序 员 掌握 的 一 种 方法 。 循 环 展开 是 扩大 一 个 循环 的 过 程 ， 这 样 每 个 新 的 迭代 都 包含 几 个 原 
来 的 迭代 ， 从 而 在 每 个 循环 迭代 中 可 以 进行 更 多 的 计算 。 通 过 这 种 方式 ,每 次 循环 都 处 理 几 个 
循环 迭代 。 例 如 : 


for (i = 1; i <= 30; i+ +) 
alil] = ai + bli] * es 


当 展 开 ( 两 次 ) 就 变 成 了 : 
fOr (Es Ty 30y i+=3){ 
aLli) SL] Di ws 
al[i+1] = aa[i+l] + b[i+1l] * Ci 
a[li+2] = a[i+2] + bl[i+2] * c; } 
初次 检查 时 ， 这 看 上 去 似乎 是 一 种 不 好 的 编写 代码 的 方法 。 但 它 减少 了 循环 开销 (如 索引 
变量 的 维护 ) ， 并 有 助 于 控制 流水 线 中 的 冒险 。 它 通常 可 使 不 同 循环 迭代 中 的 操作 并 行 执行 。 
此 外 ， 由 于 它 具有 较 少 的 数据 依赖 和 更 好 的 寄存 器 ， 因 此 它 允 许 更 好 的 指令 调度 。 显 然 ， 这 会 
使 代码 量 增加 了 ， 所 以 它 不 是 在 程序 的 每 个 循环 中 都 可 采用 的 技术 。 它 最 好 用 于 那些 占 执 行 时 
间 很 大 一 部 分 的 代码 段 。 当 将 其 应 用 到 程序 中 产生 最 大 改进 的 部 分 时 ， 优 化 努力 会 给 予 最 大 回 
报 。 这 种 技术 也 适用 于 while 循环 ， 尽 管 它 的 应 用 并 不 那么 直接 。 
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另 一 种 有 用 的 循环 优化 技术 是 循环 合并 。 循 环 合并 是 把 那些 使 用 相同 数据 项 的 循环 进行 合 
这 可 以 提高 缓存 性 能 ， 提 高 指令 级 并 行 性 并 减少 循环 开销 。 下 面 为 循环 上 的 循环 合并 : 


for (i=0; i<N; I++) 
Gil = Al + Blils 

for (i=0; i<N; i++) 
DI[i] = E[i] + CI[il]; 


会 得 到 : 


for (i=0; i<N; i++) { 
cril = A[i] + BI[i]; 
D[i] = E[i] + C[i];} 


有 时 候 ， 循 环 合并 的 可 能 性 并 不 像 上 例 那 么 明显 。 给 定 代码 段 : 


for (i=1; i<100; I++) 
A[i] = B[i] + 8; 

for (i=1l; i<99; i++) 
EU = A[li#1] * 4; 


现在 还 不 清楚 如 何 合 并 这 些 循环 ， 因 为 第 二 个 循环 使 用 的 是 A 数组 中 的 值 ， 它 是 循环 计数 
器 前 面 的 一 个 值 。 不 过 ， 我 们 可 以 轻松 地 重 写 此 代码 : 


A[1] = B[1] + 8 

for (i=2; i<100; i++) f{ 
A[i] = B[i] + 8;} 

for (i=1; i<99; i++) { 
cril = A[i+1] * 4; } 


现在 我 们 准备 好 合并 这 些 循环 了 : 


二 二 工 。 
A[i] = B[i] + 8; 
for (j=0; j<98; j++) { 
二 过 可 二 2 
A[i] = BI[i] + 8; 
: 天 -下 7 
C[i] = A[i+1] * 4; } 


循环 分 解 ， 将 大 循环 分 割 成 小 循环 ， 在 循环 优化 中 也 有 一 席 之 地 ， 因 为 它 可 以 消除 数据 依 
赖 性 并 减少 因 冲 突 带 来 的 缓存 延迟 。 循 环 分 解 的 一 个 例子 是 循环 剥离 ， 它 是 从 循环 中 移 走 开始 
或 结束 语句 的 过 程 。 这 些 语 句 通常 包含 循环 的 边界 条 件 。 如 以 下 代码 : 


for (i=1; i<N+1; i++) { 


于 


if (i==1) 

A[i] = 0; 
else if (i= =N) 
A[li] = N; 

else 


A[i] = A[i] + 8;} 


变 成 : 


A[1] = 0; 

for (i=2; i<N; 1i++) 
A[li] = A[i] + 8; 

A[N] = N; 


由 于 从 循环 中 移 除 了 分 支 语 句 ， 所 以 这 个 循环 剥离 的 例子 带 来 了 更 多 的 指令 级 并 行 。 

我 们 已 经 提 到 过 循环 交换 ， 这 是 重新 安排 循环 的 过 程 ， 以 使 存储 器 被 访问 的 方式 更 接近 于 
数据 被 存储 的 方式 。 在 大 多 数 语 言 中 ， 循 环 以 行 优先 方式 存储 。 以 行 优先 的 顺序 访问 数据 会 比 
以 列 优先 顺序 访问 减 小 缓存 失效 且 局 部 性 更 好 。 
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循环 优化 是 提高 程序 性 能 的 重要 工具 。 它 演示 了 如 何 使 用 计算 机 组 成 和 体系 结构 的 知识 编 
写 更 好 的 程序 。 前 面 给 出 的 相关 内 容 中 包含 了 在 优化 程序 代码 时 要 记 住 的 一 系列 注意 事项 。 请 
仔细 考虑 这 些 方法 ， 其 中 每 个 提示 都 考虑 了 各 种 系统 组 成 部 分 。 你 应 该 能 够 解释 每 一 个 提示 背 
后 的 原理 。 

你 尝试 越 多 ， 就 会 越 成 功 。 要 记 住 ， 急 于 使 性 能 提高 的 一 种 方法 不 会 直接 生效 。 很 多 时 
候 ， 这 些 想法 必须 结合 起 来 ， 才 能 显现 出 效果 。 


11.6 磁盘 性 能 


尽管 CPU 和 内 存 的 性 能 是 系统 性 能 中 的 重要 组 成 ， 但 是 优化 磁盘 性 能 对 系统 吞吐 量 也 很 
关键 。 大 多 数 用 户 和 系统 的 交互 包括 某 些 类 型 的 磁盘 输入 和 和 输出。 而且 ， 缺 页 会 引起 磁盘 
0， 它 出 现 的 时 机 和 持续 时 间 超 出 了 用 户 或 程序 员 的 控制 范围 。 具 有 一 个 功能 正常 的 IO 子 系 
统 ， 总 的 系统 吞吐 量 要 比 运行 一 个 差劲 的 VO 子 系统 高 一 个 数量 级 。 由 于 性 能 差异 如 此 之 高 ， 
所 以 磁盘 系统 必须 从 一 开始 就 得 好 好 设计 并 好 好 配置 。 在 整个 系统 的 生命 周期 中 ， 磁 盘子 系统 
必须 不 断 地 监视 和 调整 。 在 本 节 中 ,介绍 了 IO 系统 性 能 的 主要 方面 。 无 论 是 选择 新 系统 还 是 
想 使 现 有 系统 处 于 最 佳 运行 状 态 ， 这 里 介绍 的 一 般 概念 都 是 有 用 的 。 


11.6.1 理解 问题 


磁盘 驱动 器 性 能 问题 在 整个 系统 性 能 中 显得 尤为 突出 ， 原 因 就 是 相对 于 磁盘 或 内 存 速度 ， 
从 磁盘 中 检索 一 个 条 目 需要 很 长 的 时 间 。 当 操作 数 存 到 寄存 器 时 ，CPU 执行 一 条 指令 仅 需 几 纳 
秒 的 时 间 。 当 CPU 完成 任务 之 前 需要 从 内 存 中 取 操作 数 时 ， 执 行 指令 的 时 间 将 增加 到 数 十 纳 
秒 。 但 当 操作 数 必须 从 磁盘 中 读 取 ， 这 时 完成 任务 所 需 时 间 就 会 猛 增 到 几 十 毫秒 一 百 万 倍 的 
增加 ! 而 且 ， 由 于 CPU 可 以 比 磁盘 驱动 器 更 快 地 发 送 VO 请 求 ， 所 以 磁盘 驱动 器 就 有 可 能 成 
为 吞吐 量 瓶 颈 。 事 实 上 ， 当 一 个 系统 显示 出 CPU 利用 率 “ 低 ”时 ， 可 能 是 因为 CPU 在 不 断 地 
等 待 /0 请 求 的 完成 。 这 样 的 系统 是 1/O 密集 型 的 。 
对 于 10 性 能 最 重要 的 一 个 指标 是 磁盘 利用 率 ， 即 磁盘 忙于 服务 0 请 求 的 时 间 百分比 。 
换 句 话说 ,磁盘 利用 率 给 出 了 当 另 一 个 1/O 请 求 到 达 磁盘 服务 队列 时 磁盘 处 于 繁忙 状态 的 概 
率 。 利 用 率 取决 于 磁盘 的 速度 和 请 求 到 达 服务 队列 的 速率 。 用 数学 公式 来 表示 : 
利用 率 = 请 求 到 达 速率 
磁盘 服务 速率 
其 中 ,到 达 速 率 是 以 每 秒 请 求 数 给 出 的 ， 磁 盘 服务 速率 是 由 每 秒 VO 操作 数 (IOPS ) 给 





定 的 。 
举例 说 明 ， 假 设 某 磁盘 驱动 器 在 15ms 内 完成 一 次 WO 操作 。 这 表示 其 服务 速率 大 约 是 67 
次 VO 操作 /s(0.015s 完成 一 次 操作 =66.7 次 操作 /s) 。 如 果 这 个 磁盘 每 秒 到 达 33 次 1O 请 求 ， 
那么 就 说 它 的 利用 率 约 为 50% 。50% 的 利用 率 对 实际 应 用 的 任何 系统 来 说 性 能 都 算是 好 的 了 。 
但 是 ， 如 果 系统 的 LO 请 求 速率 是 60 次 /s， 又 会 发 生 什么 呢 ? 或 者 每 秒 64 次 请 求 呢 ? 可 以 使 
用 队列 理论 的 结果 模拟 增加 负载 的 影响 。 简 而 言 之 ， 一 次 请 求 在 队列 中 花费 的 时 间 是 和 服务 时 
间 以 及 磁盘 的 忙 概率 直接 相关 的 ， 和 磁盘 空闲 的 概率 间接 相关 。 写 成 公式 的 形式 为 ; 
, _ (服务 时 间 x 利用 率 ) 
在 队列 中 花费 的 时 间 = “放生 证 ，) 

通过 替换 很 容易 看 到 ， 当 1/O 请 求 到 达 率 是 60 次 请 求 /s 时 ， 服 务 时 间 是 15ms， 利 用 率 为 
90% 。 因 此 ， 一 个 请 求 将 不 得 不 在 队列 中 等 待 135ms。 这 个 请 求 的 总 服务 时 间 为 135ms + 15ms = 
150ms。 在 64 次 请 求人 s 时 ( 仅 增 长 7% ) ， 完 成 时 间 猛 增 到 370ms( 增 加 147% ) 。 当 65 次 请 求 /s 
时 ， 在 15ms 完成 一 次 WO 操作 的 磁盘 驱动 器 上 所 获得 的 服务 时 间 超过 了 0. 5s! 








排队 时 间 和 利用 率 之 间 的 关系 ( 见 上 面 的 公式 ) 如 图 11-1 所 示 。 从 图 中 可 以 看 到 ， 曲 线 的 
“拐点 ”( 斜率 变化 最 剧烈 的 点 ) 大约 是 78% 。 
这 就 是 为 什么 80% 的 利用 率 是 大 多 数 磁 盘 驱 
动 器 的 经 验 上 限 。 

从 模型 中 可 以 很 容易 地 看 出 事情 是 如 何 
失控 的 。 如 果 持 续 请 求 率 为 每 秒 有 68 个 IO 
请 求 , 那么 这 个 磁盘 就 会 不 堪 重 负 。 如 果 
25% 的 请 求生 成 两 个 磁盘 操作 ， 会 发 生 什么 
情况 呢 ? 这 些 场 景 会 导致 更 复杂 的 模型 ， 但 
这 个 问题 的 最 终 解 决 方案 在 于 寻找 一 种 方法 
将 服务 时 间 保 持 在 绝对 最 小 值 。 这 就 是 磁盘 


0.14 


以 秒 计算 的 磁盘 排队 时 间 
p= 
SS 


0.06 
性 能 优化 的 全 部 内 容 。 
11. 6.2 物理 因素 | 


在 第 7 章 中 ， 我 们 介绍 了 决定 磁盘 物理 0.02 
性 能 的 指标 。 这 些 指标 包括 旋转 延迟 (一 个 
磁盘 的 额定 转速 ) 、 寻 道 时 间 ( 磁盘 臂 从 初始 50 60 70 80 90 
位 置 移 动 到 指定 磁道 的 时 间 ) 和 传输 率 ( 读 / 利用 率 
写 磁 头 将 数据 从 磁盘 表面 传送 到 系统 总 线 的 图 11-1 磁盘 排队 时 间 相 对 利用 率 的 示意 图 
速率 ) 。 旋 转 延 迟 和 寻 道 时 间 之 和 表示 磁盘 的 存 取 时 间 。 

较 低 的 存 取 时 间 和 较 高 的 传输 率 有 助 于 降低 总 服务 时 间 。 也 可 以 通过 给 磁盘 增加 盘 片 ， 或 
给 系统 增加 更 多 的 磁盘 来 减少 服务 时 间 。 在 VO 系统 中 使 磁盘 数量 增加 二 倍 通常 会 使 吞吐 量 增 
加 50% 。 用 相同 数量 的 快速 磁盘 替换 现 有 磁盘 也 可 以 显著 提高 性 能 。 例 如 ， 用 10 000r/min 的 
磁盘 更 换 掉 7200r/min 的 磁盘 可 以 带 来 性 能 上 10% ~ 50% 的 提升 。 物 理 磁 盘 性 能 指标 通常 公开 
在 制造 商 提供 的 说 明 书 中 。 因 此 ， 品 牌 之 间 的 比较 通常 是 很 直观 的 。 但 是 实际 的 性 能 可 能 会 因 
使 用 条 件 不 同 而 有 所 不 同 。 性 能 与 磁盘 是 如 何 使 用 的 以 及 固有 功能 有 很 大 关系 。 原 始 速度 有 它 
的 局 限 性 。 


11. 6. 3 逻辑 因素 


有 时 ， 解 决 慢 速 系统 的 唯一 办 法 就 是 添加 或 替换 磁盘 。 但 这 一 步 只 有 在 所 有 其 他 措施 都 失 
败 后 才能 采取 。 在 下 面 的 小 节 中 ,我 们 将 讨论 逻辑 磁盘 性 能 的 几 个 方面 。 磁 盘 性 能 的 逻辑 因素 
是 那些 给 我 们 提供 优化 和 调整 的 机 会 和 改善 系统 操作 的 常规 部 分 的 任务 。 

磁盘 调度 

在 大 多 数 磁盘 配置 中 ,磁盘 臂 运 动 消耗 的 服务 时 间 最 大 。 平 均 旋转 延迟 (磁盘 在 读 / 写 头 下 
旋转 到 目标 扇 区 所 花费 的 时 间 ) 对 于 7200rxmin 的 磁盘 大 约 需 要 移动 4ms，10 000r/min 磁盘 大 
约 需要 3ms( 这 种 延迟 是 旋转 半 圈 所 需要 的 时 间 ) 。 对 同类 磁盘 ， 平 均 寻 道 时 间 ( 将 读 / 写 磁 头 定 
位 到 目标 磁道 所 需 时 间 ) 从 5 ~ 10ms 不 等 。 在 许多 情况 下 ， 这 是 磁盘 旋转 延迟 时 间 的 两 倍 。 而 
且 ， 实 际 寻 道 时 间 可 能 比 平 均 时 间 慢 得 多 。 在 一 次 全 行程 寻 道 过 程 中 需要 多 达 15 ~ 20ms 的 时 
间 ( 磁 盘 臂 从 最 内 侧 移动 到 最 外 侧 ， 或 反之 ) 。 

显然 ， 提 高 磁盘 性 能 的 途径 之 一 是 找到 最 小 化 磁盘 臂 运 动 的 方法 。 这 可 以 通过 优化 磁盘 鹿 
区 的 请 求 顺序 来 完成 。 磁 盘 调度 可 以 是 磁盘 控制 器 或 主机 操作 系统 的 功能 ， 但 两 者 不 应 同时 包 
含 这 项 功能 ， 因 为 这 可 能 会 导致 调度 冲突 ， 从 而 使 吞吐 量 降低 。 
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最 简单 的 磁盘 调度 策略 是 先 到 先 服务 (FCFS)。 顾 名 思 义 ， 所 有 LO 请 求 都 按照 它们 到 达 
磁盘 服务 队列 的 顺序 进行 服务 。 理 解 这 个 问题 最 简单 的 方法 是 通过 一 个 例子 。 假 设 一 个 有 100 
条 磁道 的 磁盘 ， 磁 道 编号 为 0 ~ 99。 在 系统 中 运行 的 进程 发 出 按 以 下 顺序 从 磁盘 读 取 磁 道 的 
请 求 : 

28,35,.52.6,46,62,19,75 ,21 

使 用 FCFS 调度 策略 ,假设 目前 正在 服务 磁道 40 ,磁盘 臂 跟踪 模式 见 图 11-2。 从 图 中 可 以 

看 出 ， 在 完成 这 一 系列 请 求 之 前 ， 磁 盘 臂 会 改变 6 次 方向 ， 遍 历 了 291 条 磁道 。 


磁道 10 20 30 4 5 0 70 8 


时 间 


图 11-2 使 用 先 到 先 服务 磁盘 调度 策略 的 寻 道 轨迹 


当然 ， 如 果 将 请 求 排序 ， 使 磁盘 臂 仅 运动 到 离 它 当 前 位 置 最 近 的 磁道 ， 则 磁盘 臂 的 运动 会 
显著 减少 。 这 就 是 最 短 寻 道 时 间 ( SSTF ) 优 先 调度 算法 采用 的 思想 。 使 用 和 上 边 一 样 的 磁道 请 
求 序列 ， 假 设 磁盘 辟 从 磁道 40 开始 ， 使 用 SSTF 磁盘 调度 策略 会 产生 如 下 顺序 : 

35 ,28 ,21 ,19 ,6 ,46 ,52 ,62 ,75 

这 种 调度 模式 如 图 11-3 所 示 。 可 以 看 出 ， 磁 盘 臂 仅 改变 一 次 方向 并 总 共 遍 历 了 103 条 磁 
道 。SSTF 的 一 个 缺点 是 有 可 能 会 出 现 饿 死 的 情况 : 理论 上 ， 如 果 一 个 磁道 请 求 位 置 远离 当前 
磁盘 臂 的 位 置 ， 那 么 当 靠近 当前 磁盘 臂 位 置 的 请 求 到 达 时 ， 远 离 当 前 磁盘 臂 位 置 的 请 求 可 能 会 
一 直 在 队列 的 后 面 。 有 趣 的 是 ， 这 种 调度 问题 是 在 最 糟糕 的 下 磁盘 利用 率 低 。 


磁道 10 20 30 40 50 60 70 80 90 





图 11-3 使 用 最 短 寻 道 时 间 优 先 调度 策略 的 磁盘 臂 运动 轨迹 


为 了 避免 SSTF 策略 有 饿 死 的 风险 ， 在 系统 中 必须 设计 一 些 公 平 机 制 。 一 个 简单 的 实现 方 
法 是 让 磁盘 臂 不 断 地 扫 过 磁盘 表面 ， 当 它 所 到 达 的 磁道 是 队列 中 所 请 求 的 一 个 磁道 时 就 停 下 
来 。 这 种 方法 称 为 电梯 算法 ， 因 为 它 与 摩天 大 楼 中 电梯 服务 乘客 的 方式 相似 。 在 磁盘 调度 中 ， 
电梯 算法 称 为 SCAN( 不 是 缩写 ) 。 为 了 说 明 SCAN 策略 是 如 何 工 作 的 ， 假 设 在 我 们 的 示例 中 ， 
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磁盘 臂 恰好 位 于 磁道 40 并且 正 在 向 内 部 、 编 号 更 大 的 磁道 方向 扫描 。 对 同一 请 求 序 列 ，SCAN 
算法 按 以 下 顺序 读 取 磁盘 磁道 : 

46 .5262 15 35. .28 21, 9356 

磁盘 臂 在 读 取 磁道 75 和 磁道 35 之 间 遍 历 了 99 条 磁道 ， 然 后 ， 在 读 磁道 6 之 后 ， 回 到 了 磁 

道 0， 如 图 11-4 所 示 。SCAN 算法 有 一 个 名 为 C-SCAN 的 变种 在 环形 扫描 中 ,磁道 0 被 视 为 与 
磁道 99 相 邻 。 换 句 话 说 ,磁盘 辟 只 沿 一 个 方向 运动 ， 如 图 11-5 所 示 。 一旦 它 通 过 磁道 99, 它 
就 移动 到 磁道 0 而 不 停止 。 因 此 ， 在 我 们 的 例子 中 ，C-SCAN 将 按 如 下 顺序 读 取 磁盘 磁道 : 

46, S52; 62, 75, 6 19, 21, .28 35 

磁道 10 20 30 40 50 60 70 80 90 


时 间 








图 11-5 C-SCAN 磁盘 调度 算法 中 磁盘 臂 的 运动 


通过 使 用 LOOK 和 C-LOOK 算法 ，SCAN 和 C-SCAN 磁盘 臂 的 运动 可 以 更 进一步 减少 。 在 
我 们 的 例子 中 ，SCAN 和 C-SCAN 不 断 扫 过 所 有 的 100 条 磁道 。 但 事实 上 ， 请 求 的 最 小 磁道 编 
号 是 6， 最 高 是 75。 因 此 ， 如 果 磁 盘 辟 只 有 在 读 取 到 最 高 和 最 低 编号 的 磁道 时 才 改 变 方向 ， 那 
么 磁盘 臂 就 能 只 遍历 69 条 磁道 。 这 使 得 磁盘 臂 的 运动 量 比 在 SCAN 和 C- SCAN 中 节省 了 
约 30% 。 

有 趣 的 是 ， 在 高 利用 率 时 ，SSTF 的 性 能 略 优 于 SCAN 和 Look。 但 饿 死 单个 请 求 的 风险 仍 
然 存 在 。 在 利用 率 非常 低 ( 低 于 20% ) 的 情况 下 ， 这 些 算法 的 任何 性 能 都 是 可 以 接受 的 。 

前 面 磁盘 调度 算法 的 讨论 很 少 涉及 文件 放置 顺序 。 如 果 最 常用 的 文件 存放 在 磁盘 的 中 心 ， 
那么 就 可 以 实现 最 大 性 能 。 尤 其 重要 的 是 ， 磁 盘 目录 和 内 存 页 (交换 ) 文 件 。 对 SSTF 和 SCAN/ 
LOOK 来 讲 ， 中 央 位 置 提供 了 最 少 的 磁头 运动 和 最 佳 的 访问 时 间 。 最 坏 的 情况 出 现在 文件 严重 
碎片 化 时 ， 也 就 是 说 ， 文 件 存放 于 多 个 相 邻 的 磁盘 位 置 时 。 如 果 磁 盘 采 用 SCAN/LOOK 调度 方 
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法 ,那么 在 读 取 文 件 结尾 之 前 ， 可 能 会 出 现 几 次 磁头 的 全 行程 移动 。 为 此 ， 磁 盘 应 定期 进行 碎 
片 整理 ， 或 重组 。 此 外 ， 磁 盘 不 应 该 占用 得 太 满 。 另 一 个 经 验 是 当 磁 盘 占 用 率 到 80% 时 ， 就 应 
该 删除 一 些 文件 了 。 如 果 没 有 文件 可 以 删除 ， 就 该 换 一 个 磁盘 了 。 

磁盘 缓存 和 预 取 

当然 ， 减 少 磁 盘 臂 运动 的 最 好 方法 是 尽 最 大 可 能 不 使 用 磁盘 。 考 虑 到 这 个 ， 许 多 磁盘 驱动 
回 或 磁盘 驱动 器 控制 器 都 提供 了 高 速 缓存 存储 器 。 这 个 存储 器 可 以 通过 一 些 专用 主 存 页 来 补 
充 ， 这 些 主 存 页 是 专门 用 于 IO 子 系统 的 。 磁 盘 高 速 缓存 通常 采用 组 相 联 。 因 为 ， 组 相 联 缓存 
搜索 有 点 耗 时 ， 性 能 可 能 比较 小 的 磁盘 缓存 更 高 一 点 ， 因 为 它 的 命中 率 通常 很 低 。 

对 应 于 IO 子 系统 的 主 存 页 作为 磁盘 的 二 级 缓存 来 使 用 。 在 大 型 服务 器 上 ， 为 此 目的 留 出 
的 页 数 是 一 个 可 调 的 系统 参数 。 如 果 主 存 想 让 利用 率 高 ， 分 配给 YO 子 系统 的 页 面 数量 就 必须 
减少 。 否 则 ， 会 导致 大 量 的 缺 页 ， 从 而 破坏 了 使 用 主 存 作为 WO 高 速 缓存 的 目的 。 

主 存 储 器 1/0 缓存 可 以 通过 在 主机 上 运行 操作 系统 软件 来 管理 ， 也 可 以 由 生成 WO 的 应 用 
程序 来 管理 。 应 用 级 缓存 管理 通常 提供 了 优越 的 性 能 ， 因 为 它 可 以 利用 应 用 程序 的 专 有 特性 。 
最 好 的 应 用 程序 会 给 用 户 一 些 对 缓存 大 小 的 控制 权 ， 这 样 就 可 以 让 用 户 针对 主机 的 主 存 利 用 率 
来 对 缓存 大 小 进行 调整 ， 以 防止 发 生 过 多 的 缺 页 。 

很 多 基于 磁盘 驱动 器 的 缓存 使 用 预 取 技术 来 减少 磁盘 访问 时 间 。 预 取 在 概念 上 类 似 于 CPU 
到 主 存 的 缓存 技术 : 两 者 都 是 利用 局 部 性 原则 以 获得 更 好 性 能 的 。 当 使 用 预 取 技 术 时 ， 一 个 磁 

会 读 取 请 求 扇 区 后 面 的 扇 区 ， 并 期 望 一 个 或 多 个 后 续 扇 区 也 “很 快 ”会 用 到 。 实 际 研究 表 
明 ，50% 以 上 的 磁盘 访问 在 本 质 上 是 连续 的 ， 因 此 预 取 技术 使 性 能 平均 增加 了 40% 。 

预 取 的 缺点 是 有 高 速 缓存 污染 现象 。 当 缓存 中 填充 了 不 需要 的 数据 时 ， 缓 存 污 染 就 会 发 
生 ， 从 而 使 有 用 数据 的 可 用 空间 变 小 。 与 主 存 缓存 一 样 ， 可 采用 不 同 的 替换 算法 来 保持 缓存 清 
洁 。 这 些 策 略 和 CPU 到 主 存 缓存 中 使 用 的 一 样 (LRU、LFU 以 及 随机 替换 算法 ) 。 此 外 ， 由 于 
磁盘 缓存 充当 着 写 和 到 磁盘 数据 的 中 转 区 ， 所 以 一 些 磁盘 缓存 管理 方案 简单 地 收回 已 写 人 磁盘 
的 所 有 字 节 。 

读 取 数据 和 将 数据 写 入 磁盘 的 根本 区 别 导 致 了 许多 环 手 的 缓存 问题 。 首 先 也 是 最 重要 
的 ， 缓 存 是 易 失 性 存储 器 。 如 果 发 生 大 规模 系统 故障 ， 则 缓存 中 的 数据 就 都 丢失 了 。 假 设 
运行 在 主机 上 的 应 用 程序 确信 数据 已 经 提交 到 磁盘 ， 而 实际 上 数据 却 还 驻 留 在 缓存 中 。 如 
果 缓 存 失败 ， 数 据 就 会 消失 。 这 会 导致 严重 的 数据 不 一 致 ， 如 ATM 吐出 了 钱 ， 却 没有 记 在 
客户 账户 中 。 

为 了 防止 缓存 掉 电 ,一些 基于 磁盘 控制 器 的 缓存 会 进行 镜像 并 给 它 提 供 一 个 备用 电池 。 当 
缓存 镜像 时 ， 控 制 器 包含 两 个 相同 的 缓存 ; 它们 同时 运行 ， 每 个 时 刻 都 包含 相同 的 数据 。 另 一 
种 方法 是 采用 第 6 章 中 讨论 的 写 直通 缓存 。 在 缓存 中 保留 数据 副本 ， 以 备 “ 很 快 地 ”再 次 用 
到 ， 但 它 同 时 会 写 入 到 磁盘 中 。 操 作 系统 发 出 的 信号 表示 只 有 在 数据 实际 存放 到 磁盘 上 之 后 ， 
LO 才 算 完成 。 为 了 提供 更 好 的 可 靠 性 ， 性 能 在 一 定 程 度 上 会 受到 损害 。 

当知 吐 量 比 可 靠 性 更 重要 时 ， 系 统 可 以 使 用 写 回 缓存 策略 。 回 想 一 下 可 知 ， 有 两 种 类 型 的 
写 回 策略 。 最 简单 的 是 磁盘 周期 性 地 读 取 缓存 (通常 每 分 钟 两 次 ) ， 并 将 它 找到 的 所 有 脏 块 都 
写 人 磁盘 。 如 果 关 注 可 靠 性 ， 则 上 述 周 期 可 以 缩短 (以 牺牲 性 能 为 代价 ) 。 一 种 更 复杂 的 写 回 
算法 采用 机 会 写 和 信 。 通 过 这 种 方法 ， 脏 块 在 缓存 中 等 待 ， 直 到 对 同一 个 柱 面 的 读 取 请 求 到 达 为 
止 。 写 操作 由 读 操 作 “ 撒 带 ” 着 。 这 种 方法 会 降低 读 取 性 能 ,但 可 以 提高 写 和 人 的 性 能 。 许 多 
系统 将 周期 写 回 和 机 会 写 回 策略 结合 起 来 使 用 ， 力 求 在 效率 和 可 靠 性 之 间 取 得 平衡 。 

选择 优化 磁盘 性 能 所 涉及 的 折 中 方案 是 很 困难 的 。 我 们 的 首要 职责 是 确保 数据 的 可 靠 性 和 
一 致 性 。 但 是 ， 当 易 失 性 缓存 补偿 了 访问 时 间 延 迟 时 ， 也 就 实现 了 最 高 硅 吐 量 。 带 后 备 电 池 的 
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缓存 很 昂贵 。 增 加 磁盘 以 提高 吞吐 量 也 是 一 种 昂贵 的 选择 。 从 磁盘 写 操作 中 去 掉 缓 存 中 介 可 能 
会 导致 性 能 下 降 ， 尤 其 是 在 磁盘 利用 率 高 的 情况 下 。 用 户 很 快 就 会 抱怨 响应 时 间 过 长 ， 而 当 你 
要 求 他 们 为 磁盘 升级 付费 时 ， 财 务 人 员 就 会 抱怨 。 请 记 住 ， 无 论 价格 多 贵 ， 升 级 磁盘 子 系统 总 
比 找 回 丢失 的 数据 更 便宜 。 


本 章 小 结 

本 章 给 出 了 描述 计算 机 性 能 的 两 个 方面 : 性 能 评价 和 性 能 优化 。 你 应 该 从 本 章 中 了 解 了 计算 机 性 能 
的 关键 度量 以 及 如 何 正 确 地 总 结 它们 。 具 体 来 说 ， 应 该 知道 算术 平均 不 适用 于 剧烈 变化 的 数据 ， 不 应 该 
与 速率 或 比率 一 起 使 用 。 当 数据 剧烈 变化 时 ， 几 何平 均 是 有 用 的 ,但 这 个 值 不 能 用 来 预测 性 能 。 调 和 平 
均 适合 比较 速率 ， 它 也 可 用 于 性 能 预测 。 但 是 ， 当 使 用 调和 平均 来 比较 相对 的 系统 性 能 时 ， 对 参考 机 的 
选择 要 比 几何 平均 更 为 敏感 。 

在 本 章 中 ， 解 释 了 一 些 比较 流行 的 基准 测试 程序 和 测试 集 。 其 中 最 可 靠 的 是 由 公平 的 监督 机 构 ( 如 
SPEC 和 TPC ) 制定 和 管理 的 基准 。 不 管 使 用 哪 一 种 ， 基 准 都 应 该 根据 特定 的 应 用 程序 来 解释 。 记 住 ， 没 
有 一 个 单一 的 度量 标准 可 以 普遍 适用 于 所 有 情况 。 

计算 机 性 能 直接 依赖 于 计算 机 部 件 的 优化 。 我 们 研究 了 计算 机 主要 系统 部 件 性 能 的 影响 因素 。 由 于 
使 用 各 种 优化 技术 和 设置 了 性 能 提高 的 上 限 ， 阿 姆 达尔 定律 给 我 们 提供 了 一 个 确定 潜在 加 速 比 的 工具 。 
需要 优化 的 领域 包括 CPU 性 能 、 内 存 性 能 和 IO。CPU 性 能 依赖 于 程序 代码 、 编 译 技 术 、ISA 和 硬件 的 
底层 技术 。 分 支 指令 对 流水 线性 能 有 巨大 的 影响 ， 它 反 过 来 对 CPU 性 能 会 有 重要 的 影响 。 分 支 预测 是 消 
除 由 分 支 带 来 的 问题 的 一 种 方法 。 固 定 和 静态 的 分 支 预测 方法 比 动态 技术 的 准确 度 低 ， 但 是 可 以 用 更 低 
的 成 本 实现 。 

LO 性 能 是 磁盘 驱动 器 逻辑 和 物理 特性 的 函数 。 如 果 不 更 换 硬 件 ， 就 无 法 提高 物理 磁盘 的 性 能 。 但 
是 逻辑 磁盘 性 能 的 许多 方面 都 适合 于 调 优 和 优化 。 这 些 因 素 包 括 磁盘 利用 率 、 文 件 存放 和 存储 器 缓存 的 
大 小 。 良 好 的 性 能 报告 工具 不 仅 会 提供 完整 的 IO 统计 数据 ， 而 且 还 会 提供 调 优 建议 。 

系统 性 能 评价 和 优化 是 系统 管理 员 的 两 项 最 重要 的 任务 。 在 本 章 中 ， 只 给 出 了 与 平台 无 关 的 一 般 信 
息 。 一 些 最 有 用 和 最 有 趣 的 信息 可 在 供应 商 提供 的 手册 和 培训 研讨 会 上 找到 。 这 些 资源 对 于 系统 调 优 工 
作 的 持续 有 效 性 至 关 重 要 。 
扩展 阅读 

在 计算 机 总 体 设计 背景 下 ，Hennessy 和 Patterson(2011 ) 的 书 提出 了 最 受 重视 的 计算 机 性 能 处 理 方 法 
之 一 。 书 中 将 性 能 考虑 贯穿 于 计算 机 体系 结构 的 各 个 方面 。 一 本 专门 介绍 计算 机 性 能 的 综合 教科 书 是 
Lilja(2005 ) 编写 的 ， 其 可 读 性 强 并 深入 讲解 了 系统 度量 的 分 析 和 设计 。 它 对 数学 性 能 评估 的 介绍 因为 清 
晰 性 强 ， 所 以 是 尤其 值得 注意 的 。Severance 和 Dowd (1998 ) 的 书 具 有 很 好 的 程序 和 调试 软件 以 及 基准 ， 
包括 高 性 能 计算 的 详细 信息 。Musumeci 和 Loukides(2002 ) 的 书 也 对 系统 性 能 提供 了 很 好 的 介绍 。 

除了 上 边 引 用 的 这 些 书 ，Fleming 和 Wallace(1996 ) 以 及 Smith(1998 ) 的 论文 为 选择 正确 的 统计 方法 提 
供 了 坚实 的 数学 依据 。 他 们 还 对 性 能 指标 具有 争议 的 本 质 进 行 了 讨论 。 

在 讨论 统计 陷阱 和 廖 误 时 ， 不 讨论 统计 学 的 图 形 表示 也 会 导致 得 出 不 正确 的 结论 和 假设 。 如 果 想 研 
究 通过 图 形 设备 显示 的 统计 信息 ， 推 荐 你 详细 阅读 Tufte(2001 ) 的 书 。 你 会 感到 惊讶 、 高 兴 和 困惑 。 我 们 
也 推荐 Huff(1993 ) 经 典 的 书 。 这 本 薄 薄 的 书 (原本 是 1954 出 版 的 ) 用 的 信息 和 插图 娱乐 读者 已 经 近 60 
年 了 

Price( 1989 ) 的 论文 对 很 多 早期 的 综合 基准 做 了 很 好 的 描述 ， 这 些 基准 包括 Whetstone 、Dhrystone 以 及 
其 他 几 种 本 章 没 有 讲 到 的 基准 。 另 一 本 综合 概括 早期 基准 的 论文 见 Serlin(1986 ) 的 文章 。Weicker( 1984) 
的 书 中 给 出 了 原始 的 Dhrystone 基准 。 之 后 他 在 1990 年 的 研究 中 也 给 出 了 包括 LINPACK 、Whetstone 和 一 
些 20 世纪 80 年 代 就 已 经 出 现 的 基准 (比如 SPEC 组 件 ) 。Grace(1996 ) 的 书 对 每 一 种 主要 的 基准 都 有 着 详 
尽 的 描述 。 它 覆盖 了 包括 本 章 和 许多 其 他 的 内 容 ， 包 括 特定 于 Windows 和 UNIX 环境 的 基准 。 

令 人 惊讶 的 是 ，MFLOPS 的 数字 源 自 标准 的 基准 测试 程序 ， 这 与 早期 的 浮 点 SPEC 基准 密切 相关 。 你 
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会 发 现 Giladi(1996 ) 的 书 中 对 这 种 异常 进行 了 详细 的 论述 ， 书 中 也 深入 讨论 了 Linpack 浮 点 基准 。 对 于 
SPEC CPU 基准 测试 的 详细 解释 ， 见 Henning(2006) 。 对 于 所 有 的 SPEC 基准 测试 可 以 在 SPEC 的 网 站 找 
到 ， 网 址 为 www. spec. org。 

TPC 基准 测试 的 开创 性 文章 是 由 Jim Gray(1985 ) 匿名 发 表 的 。( 他 赞扬 了 许多 影响 TPC 最 终 形式 的 
人 ， 因 为 他 把 论文 交 给 了 成 千 上 万 的 人 以 听取 他 们 的 建议 。 他 拒绝 单独 署名 ， 匿 名 发 表 了 论文 。 所 以 许 
多 人 引用 此 源 为 “无 名 氏 等 人 。” ) 论 文 给 出 了 事务 处 理 委员 会 的 背景 和 哲学 思想 。 更 多 的 信息 可 以 在 网 站 
上 找到 : www. tpc. org TPC。 

Hsu、Smith 和 Young(2001 ) 的 书 提供 了 与 TPC 基准 比较 时 实际 工作 负载 的 详细 内 容 。 文 章 还 演示 了 
使 用 跟踪 分 析 进 行 性 能 数据 收集 。 

这 里 不 能 缺少 有 关 IO 系统 性 能 的 信息 。Hennessy 和 Patterson(2011 ) 的 书 非常 详细 地 讨论 了 这 个 话 
题 。 一 个 优秀 的 (虽然 比较 久远 ) 磁盘 调度 策略 的 研究 可 以 在 Oney(1975 ) 的 著作 中 找到 。Karedla、Love 
和 Wherry(1994) 的 著作 对 磁盘 缓存 的 性 能 提供 了 一 个 清晰 深入 的 讨论 。Reddy(1992 ) 的 著作 对 IO 系统 
结构 进行 了 很 好 的 概述 。 
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复习 题 

1. 当 我 们 说 一 个 程序 或 系统 是 存储 器 密集 型 的 时 候 ， 请 解释 这 意味 着 什么 。 我 们 还 讨论 了 哪些 密集 
类 型 ? 

. 关于 性 能 优化 ， 阿 姆 达尔 定律 告诉 了 我 们 什么 ? 

。 哪 种 均值 可 以 用 于 比较 速率 ? 

. 算术 平均 不 适用 于 哪 种 类 型 的 数据 ? 

给 出 最 佳 性 能 的 定义 。 

什么 是 性 能 价格 比 ? 什么 使 得 它 难 以 应 用 ? 

. 当 用 MIPS 或 FLOPS 衡量 系统 的 吞吐 量 时 ， 缺 点 是 什么 ? 

8. Dhrystone 基准 不 同 于 Whetstone 基准 和 Linpack 基准 之 处 是 什么 ? 
9. 由 SPEC CPU 基准 解决 的 Dhrystone 、Whetstone 和 Linpack 基准 中 不 足 之 处 是 什么 ? 
10. 解释 术语 基准 营销 。 

11. TPC 的 关注 点 和 SPEC 的 有 什么 不 同 ? 

12. 解释 延迟 分 支 。 

13. 什么 是 分 支 预测 ? 它 的 用 途 是 什么 ? 

14. 给 出 流水 线 冒 险 的 3 个 例子 。 

15. 定义 术语 循环 合并 、 循 环 分 解 、 循 环 剥 离 和 循环 交换 。 

16. 根据 排队 论 ， 什 么 是 重要 的 磁盘 利用 率 百 分 比 ? 

17. 使 用 SSTF 磁盘 调度 算法 的 风险 是 什么 ? 

18. LOOK 和 SCAN 的 区 别 在 哪里 ? 

19. 什么 是 磁盘 预 取 ? 它 的 优 缺 点 分 别 是 什么 ? 

20. 缓冲 磁盘 写 人 的 优 缺点 是 什么 ? 


习题 

*1. 表 11-2 给 出 了 系统 A 和 系统 B 两 台 计算 机 上 的 混合 执行 时 间 和 和 运行 时 间 。 在 本 例 中 ， 系 统 C 比 系统 
A 快 83%。 表 11-3 给 出 了 系统 A 使 用 不 同 执行 结构 时 的 运行 时 间 。 使 用 表 11-3 所 示 的 混合 执行 结构 ， 
计算 系统 C 会 比 系统 A 快 多 少 。 使 用 表 11-2 所 示 的 原始 统计 ， 系 统 A 的 性 能 在 新 的 执行 结构 中 会 下 
降 多 少 ? 

2. 参考 表 11-3 所 示 的 从 程序 v、w、x、y 和 z 中 引用 的 性 能 数据 ， 计 算 系 统 B 和 系统 C 使 用 系统 A 作为 
参考 系统 时 的 程序 运行 时 间 的 几何 平均 。 验 证 中 值 的 比率 与 使 用 其 他 两 个 系统 作为 参考 系统 时 得 到 的 
结果 是 一 致 的 。 

4 3. 3 个 系统 运行 5 个 基准 的 执行 时 间 见 下 表 。 比 较 每 一 个 系统 的 相对 性 能 (也 就 是 说 ,A 到 B、B 到 C 以 
及 A 到 C)， 要 求 使 用 算术 平均 和 几何 平均 。 有 什么 意料 之 外 的 事情 吗 ? 请 解释 之 。 


系统 B 的 执行 时 间 系统 C 的 执行 时 间 


飞人 AAAmDb 











系统 A 的 执行 时 间 































v 150 75 
w 200 150 
x 250 200 

400 500 












1 000 
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4. 3 个 系统 运行 5 个 基准 的 执行 时 间 见 下 表 。 比 较 每 一 个 系统 的 相对 性 能 (也 就 是 说 ,A 到 B、B 到 C 以 
及 A 到 C)， 要 求 使 用 算术 平均 和 几何 平均 。 有 什么 意料 之 外 的 事情 吗 ? 请 解释 之 。 


系统 C 的 执行 时 间 








系统 A 的 执行 时 间 系统 B 的 执行 时 间 


45 
















300 

















5. 正在 销售 数据 库 管理 优化 软件 的 公司 联系 你 推销 他 的 产品 。 其 代表 性 卖点 就 是 存储 器 管理 软件 将 会 降 
低 系统 中 的 缺 页 率 。 她 给 你 一 个 30 天 的 软件 免费 试用 期 。 但是， 在 安装 此 软件 之 前 ， 你 决定 首先 确 
定 系统 的 基准 。 在 一 天 中 的 特定 时 刻 ， 你 会 取样 并 记录 系统 中 发 生 的 缺 页 率 (使 用 系统 诊断 软件 ) 。 在 
安装 完 软件 之 后 ， 你 也 做 了 同样 的 事 。 那 么 安装 了 新 的 存储 器 管理 软件 之 后 ， 系 统 的 平均 性 能 提高 了 
多 少 ? (提示 : 使 用 调和 平均 。) 
缺 页 率 和 一 天 中 的 测试 时 刻 见 下 表 。 


时 间 ” “安装 新 软件 之 前 的 缺 页 率 


02:00 ~03:00 















10:00 ~ 11:00 | 42% | 38% 





13:00 ~ 14:00 





18:00 ~ 19:00 





6. 综合 基准 (比如 Whetstone 和 Dhrystone) 的 局 限 性 是 什么 ? 综合 基准 的 概念 能 够 扩展 以 克服 这 些 局 限 吗 ? 
请 解释 你 的 答案 。 

* 7. 如 果 一 个 销售 商 对 你 说 他 的 系统 在 运行 50% 的 SPEC 基准 核 程序 时 速度 两 倍 于 主要 竞争 对 手 的 系统 ， 
你 会 怎么 说 ?这 里 体现 的 是 什么 诬 论 ? 

8. 假设 你 正在 考虑 购买 一 台新 的 计算 机 系统 。 除 了 系统 X 的 模型 Q 之 外 ， 对 于 所 有 正在 考虑 的 系统 ， 你 
都 有 合适 的 基准 测试 结果 。 系 统 X 的 模型 $ 的 基准 测试 结果 已 经 有 了 ， 并 且 它 们 不 如 其 他 几 个 竞争 品 
牌 的 结果 好 。 为 了 完成 你 的 研究 ， 你 打 电 话 给 销售 系统 X 计算 机 的 人 ， 并 且 问 他 们 什么 时 候 公布 模型 
Q 的 测试 结果 。 他 们 说 ， 不 会 很 快 发 布 结果 ， 但 是 因为 模型 Q 的 磁盘 驱动 器 给 出 的 平均 访问 时 间 为 
12ms， 而 模型 X 的 平均 访问 时 间 为 1 5ms， 因 此 模型 Q 的 性 能 比 模型 5 要 好 25% 。 你 怎么 计算 系统 X 
的 模型 Q 的 性 能 指标 ? 

4 9. 比较 两 个 不 同 的 SPEC CPU 版 本 (如 SPEC95 和 SPEC2000) 的 测试 结果 有 什么 价值 ? 

10. 除了 零售 部 门 外 ， 还 有 哪些 机 构 需 要 交易 处 理 系统 具有 良好 的 性 能 ? 请 对 你 的 答案 做 出 解释 。 

4 11. 如 果 你 正在 考虑 购买 一 个 在 DNA 研究 中 要 用 到 的 系统 ,那么 在 本 章 所 讨论 的 基准 中 ， 哪 一 个 对 你 
最 有 用 ?你 为 什么 选择 这 个 基准 ? 你 对 其 他 基准 感 兴趣 吗 ? 请 解释 为 什么 感 兴趣 或 为 什么 不 感 
兴趣 。 

12. 假设 某 个 朋友 请 你 帮助 他 做 一 个 决定 ， 到 底 应 该 买 哪 种 计算 机 以 供 他 在 家 使 用 。 在 比较 各 制造 商 和 
模型 时 ， 你 希望 得 到 什么 ? 在 这 种 情况 下 ， 你 的 思路 和 你 给 雇主 买 可 在 因特网 上 接受 客户 订单 的 网 
络 服务 器 有 何不 同 ? 

* 13. 假设 你 刚刚 分 配 到 一 个 委员 会 工作 ， 该 委员 会 刚 接 到 购买 一 个 新 的 企业 文件 服务 器 的 任务 ， 该 服务 
器 应 支持 客户 账户 活动 以 及 许多 管理 功能 ， 例 如 生成 每 周 的 工资 报表 。( 是 的 ， 一 个 委员 会 经 常 做 出 
上 述 决 策 !) 委 员 会 中 的 一 个 成 员 刚刚 了 解 到 某 特 定 系统 已 经 在 SPEC CPU2000 基准 测试 中 淘汰 了 竞争 
对 手 。 他 现在 坚持 要 求 委 员 会 购买 这 些 系统 中 的 一 种 。 对 此 ， 你 的 反应 是 什么 ? 

*14. 我 们 讨论 了 调和 平均 应 用 于 计算 机 系统 性 能 评价 中 的 局 限 性 。 很 多 评论 家 建议 SPEC 基准 应 该 使 用 调 
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16. 


17. 


18. 


19. 


20. 
21. 


22. 
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4 24. 


全 


命 


bb 
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和 平均 来 代替 。 建 议 某 个 “工作 ”单位 重新 修订 SPEC 基准 作为 速率 指标 。 使 用 SPEC 网 站 上 的 结果 
测试 你 的 理论 ， 其 网 址 为 www. spec. org。 
SPEC 和 TPC 都 发 布 了 关于 网 络 服务 器 系统 的 基准 。 访问 这 些 组 织 的 网 址 ( www. spec. org 和 
www. tpc. org) 来 找到 相同 的 (或 可 比较 的 ) 系统 ， 它 们 在 两 个 网 站 上 都 会 公布 测试 结果 。 讨 论 你 的 
我 们 提 到 ， 在 系统 跟踪 中 会 将 大 量 的 数据 收集 到 一 起 。 为 了 使 你 对 所 包含 的 实际 数据 量 有 一 些 了 解 ， 
假设 正 计划 安 装 一 个 硬件 探测 器 ， 它 可 以 报告 系统 中 程序 计数 器 、 指 令 寄 存 器 、 累 加 器 、 存 储 器 地 
址 寄存 器 和 存储 器 缓冲 寄存 器 的 内 容 。 系 统 时 钟 频 率 为 1CHz。 在 系统 时 钟 的 每 一 个 周期 内 ， 这 5 个 
寄存 器 的 状态 都 会 写 人 到 与 探测 器 电路 连接 的 非 易 失 存储 器 中 。 假 设 每 个 寄存 器 都 是 64 位 的 ， 如 果 
探测 器 需要 收集 2s 的 数据 ， 则 它 需 要 多 大 的 存储 容量 ? 
11. 5.2 节 给 出 了 可 以 提高 程序 性 能 的 几 种 方法 。 对 于 补充 材料 中 的 每 个 提示 ， 请 说 明 其 是 否 涉及 了 
计算 机 组 成 和 体系 结构 问题 。 如 果 是 这 样 的 话 ， 请 解释 所 给 建议 背后 的 理由 。 如 果 你 觉得 补充 材料 
中 缺少 任何 内 容 ， 请 在 分 析 中 添加 你 的 建议 。 
在 讨论 磁盘 物理 方面 的 性 能 时 ， 我 们 说 ， 将 7200r/min 的 磁盘 用 10 000r/min 的 磁盘 代替 可 以 带 来 
10% ~50% 的 性 能 提升 。 为 什么 只 有 10% 的 提升 ? 难道 就 不 会 发 生根 本 就 没有 任何 提升 的 情况 吗 ? 
请 解释 。( 提示 : 旋转 延迟 不 是 决定 磁盘 性 能 的 唯一 因素 。) 
对 下 面 给 出 的 磁道 请 求 序列 ， 计 算 使 用 FCFS、SSTF、SCAN 和 LOOK 算法 进行 磁盘 遍历 时 的 磁道 数 。 
在 第 一 个 请 求 到 达 磁 盘 请 求 队列 时 ， 读 / 写 磁 头 位 于 磁道 50， 正 在 向 外 移动 (编号 小 的 方向 )。( 提 
示 : 磁盘 臂 经 过 的 每 一 条 磁道 都 会 计 人 总 数 ， 不 管 读 不 读 此 条 磁道 。) 
54, 36,. 21 ,74 460。395 26，07 

当 磁 道 请 求 序列 变 为 : 82,，97，35,，75,，53, 47，17，11， 重 新 计算 上 一 题 。 
某 个 品牌 的 磁盘 驱动 絮 的 磁盘 臂 经 过 某 条 磁道 但 不 做 停留 需要 花费 的 时 间 为 500ns。 但 是 , 一旦 磁头 
到 达 了 所 请 求 的 一 条 磁道 ， 则 在 开始 读 或 写 之 前 ， 需 要 2ms 的 时 间 “ 了 驻 留 ”在 该 磁道 上 。 基 于 这 些 
时 间 ， 比 较 采 用 FCFS、SSTF 和 LOOK 算法 完成 以 下 给 定 的 磁道 调度 所 需要 的 相对 时 间 。 你 需要 比较 
SSTF 和 FCFS、LOOK 和 FCFS 以 及 LOOK 和 SSTF 。 

与 上 面 的 问题 一 样 ， 当 第 一 个 请 求 到 达 磁 盘 请 求 队列 时 ， 读 / 写 头 位 于 磁道 50， 向 外 侧 ( 编 号 小 
的 方向 ) 磁道 移动 。 

所 请 求 的 磁道 序列 是 : 35, 53, 90, 67, 79, 37, 76, 47。 
对 下 述 给 定 的 磁道 访问 序列 (假设 读 / 写 磁头 位 于 磁道 530， 向 外 移动 ) ， 重 复 第 21 题 : 
48. 14 85; 33; 8B4, 61, 30; 22 
在 对 SSTF 磁盘 调度 算法 的 讨论 中 ,我 们 陈述 了 饿 死 问题 “最 糟糕 的 是 磁盘 利用 率 低 ” 。 请 解释 为 什 
么 这 样 。 
某 个 微 处 理 器 需要 2、3、4、8 或 12 个 机 器 周期 来 实现 各 种 操作 。 总 共有 25% 的 指令 需要 2 个 机 器 周 
期 ,20% 的 指令 需要 3 个 机 器 周期 ，17.5% 的 指令 需要 4 个 机 器 周期 ，12. 5% 的 指令 需要 8 个 机 器 周 
期 ， 最 后 还 有 25% 的 指令 需要 12 个 机 器 周期 。 
a) 在 这 个 微 处 理 器 中 每 条 指令 所 需要 的 平均 机 器 周期 数 是 多 少 ? 
b) 这 个 微 处 理 器 要 想 成 为 一 个 “1 MIPS” 处 理 器 ， 则 其 时 钟 频率 (每 秒 的 机 器 周期 数 ) 应 是 多 少 ? 
c) 假设 这 个 系统 需要 额外 20 个 机 器 周期 从 存储 器 中 取出 操作 数 。 它 必须 分 给 存储 器 40% 的 时 间 。 
则 在 这 个 微 处 理 器 中 每 条 指令 所 需 的 平均 机 器 周期 数 是 多 少 (包括 存储 器 取 指 时 间 )? 
某 个 微 处 理 器 需要 2、4、8、12 或 16 个 机 器 周期 来 实现 各 种 操作 。 总 共 17. 5% 的 指令 需要 2 个 机 器 
周期 ，12. 5% 的 指令 需要 4 个 机 器 周期 ，35% 的 指令 需要 8 个 机 器 周期 ，20% 的 指令 需要 12 个 机 器 
周期 ， 最 后 还 有 15% 的 指令 需要 16 个 机 器 周期 。 
a) 在 这 个 微 处 理 器 中 每 条 指令 所 需要 的 平均 机 器 周期 数 是 多 少 ? 
b) 这 个 微 处 理 器 要 想 成 为 一 个 1 MIPS 处 理 器 ， 则 其 时 钟 频率 (每 秒 的 机 器 周期 数 ) 应 是 多 少 ? 
c) 假设 这 个 系统 需要 额外 16 个 机 器 周期 从 存储 器 中 取出 操作 数 。 它 必须 分 给 存储 器 30% 的 时 间 。 
则 在 这 个 微 处 理 器 中 每 条 指令 所 需 的 平均 机 器 周期 数 是 多 少 ， 包 括 存储 器 取 指 的 时 间 ? 
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26. Herbert Grosch 在 20 世纪 40 年 代 就 已 经 成 为 著名 的 计算 机 科学 家 。1965 年 ， 他 提出 把 所 谓 的 “hum- 
bly” 应 称 为 Crosch 定律 。 这 个 定律 的 解释 如 下 : 


计算 机 性 能 按照 成 本 的 平方 增加 。 如 果 计 算 机 A 的 成 本 是 计算 机 B 的 两 倍 ， 那 么 你 应 该 期 望 计 
算 机 A 的 速度 是 计算 机 B 的 四 倍 。 


请 使 用 任何 TPC 基准 来 确认 或 驶 斥 这 种 说 法 。 当 把 你 的 比较 限定 在 相似 的 系统 时 ， 会 发 生 什么 ? 
更 具体 地 ， 检 查 仅 运 行 同一 类 操作 系统 和 数据 库 软件 系统 的 性 价 比 。 当 不 限定 比较 相似 系统 时 会 发 
生 什 么 ” 当 你 选择 一 个 不 同 的 基准 (比如 ，TPC-W 与 TPC-C 对 比 ) 时 ， 这 些 结果 会 改变 吗 ? 讨论 你 的 
发 现 。 


第 12 章 | 


The Essentials of Computer Organization and Architecture, Fourth Edition 
12. 1 引言 
a 已 


20 世纪 80 年 代 ，Sun 微 系 统 公 司 用 朗朗 上 口 的 口号 发 起 了 一 个 重要 的 广告 战 。 儿 十 年 前 ， 
这 种 声音 肯定 是 雷 声 大 雨点 小 , 但 是 它 就 像 是 旷野 中 的 声音 ， 它 预示 着 今天 的 全 球 商 业 核 心 是 
用 万 维 网 连接 的 世界 。 不 联网 的 商业 计算 机 现在 都 已 过 时 和 落伍 了 。 

本 章 将 介绍 庞大 而 复杂 的 数据 通信 领域， 特别 侧重 于 因特网 方面 。 我 们 将 从 历史 、 理 论 和 
实践 的 角度 审视 架构 模型 (网 络 协 议 )。 一 旦 知道 了 网 络 是 如 何 运作 的 ， 你 就 可 以 了 解构 成 网 
络 结构 的 许多 组 成 部 分 。 我 们 的 目的 是 给 你 一 个 广阔 的 技术 和 术语 视野 ， 这 些 技术 和 术语 是 每 
个 计算 机 专业 人 员 在 职业 生涯 中 都 会 遇 到 的 。 懂 计算 机 、 也 要 懂 网 络 。 


12.2 早期 的 商用 计算 机 网 络 

今天 的 计算 机 网 络 沿 着 两 个 不 同 的 路 径 发 展 。 一 条 路 径 是 针对 实现 快速 和 准确 的 业务 交易 
的 ， 而 另 一 个 的 目的 是 促进 学 术 界 和 科学 界 的 协作 和 知识 共享 。 

各 种 类 型 的 数字 网 络 都 渴望 以 尽 可 能 最 简单 、 最 快速 和 最 合算 的 方式 分 享 计算 机 资源 。 计 
算 机 越 昂贵 ， 在 尽 可 能 多 的 用 户 之 间 分 享 计算 机 的 动机 越 强 。 在 20 世纪 50 年 代 ， 大 多 数 计算 
机 价值 数 百 万 美元 ， 只 有 最 富有 的 公司 才能 买 得 起 几 个 系统 。 当 然 ， 在 远离 公司 工作 的 员工 对 
计算 机 资源 的 需求 与 在 公司 办 公 的 同事 一 样 多 ， 所 以 不 得 不 设计 一 些 方法 使 他 们 连接 到 公司 。 
几乎 每 个 厂商 都 有 不 同 的 连接 解决 方案 。 在 这 些 厂商 中 最 占 优势 的 是 IBM 的 系统 网 络 体 系 结构 
(SNA) 。 这 种 不 断 改进 的 通信 体系 结构 ， 已 经 使 用 了 30 多 年 ， 

IBM 的 SNA 是 一 种 在 物理 设备 ( 称 为 物理 单元 或 PU) 之 间 进 行 端 到 端 通信 的 规范 。 逻 辑 会 
话 (被 称 为 逻辑 单元 或 LU) 发 生 在 物理 设备 之 上 。 在 原来 的 体系 结构 中 ， 系 统 的 物理 组 成 部 分 
包括 终端 、 打 印 机 、 通 信 控 制 器 、 多 路 复 用 器 和 前 端 处 理 器 。 前 端 处 理 器 位 于 主机 (大 型 机 ) 
系统 和 通信 线路 之 间 。 它 们 管理 了 所 有 的 通信 开销 ， 包 括 轮 询 每 个 通信 控制 器 ， 通 信 控 制 器 依 
次 轮 询 每 个 连接 的 终端 。 这 种 体系 结构 如 图 12-1 所 示 。 

IBM 的 SNA 用 到 高 速 事务 项 目 和 客户 服务 查询 中 。 甚 至 在 网 速 为 9 600bits 时 ， 当 所 有 网 
络 部 件 在 正常 负载 下 工作 时 ， 访 问 主机 上 的 数据 几乎 可 以 瞬间 完成 。 然 而 ， 这 种 速度 是 以 牺牲 
灵活 性 和 互 操作 性 为 代价 的 。 管 理 和 支持 这 些 网 络 的 人 力 开销 是 巨大 的 ， 连 接 其 他 厂商 的 设备 
和 网 络 往往 是 一 项 复杂 的 软件 和 硬件 工程 。 在 过 去 的 30 年 中 ，SNA 已 经 适应 了 变化 的 商业 需 
求 和 网 络 环境 ,但 是 基础 概念 基本 上 仍 是 几 十 年 以 前 的 。 事实 上 ， 这 种 体系 结构 设计 的 如 此 
好 ， 以 至 于 它 的 许多 方面 最 终 形成 了 国际 体系 结构 (O051) 的 基础 。 我 们 会 在 12.4 节 中 讨论 
OSI。 虽 然 SNA 对 年 轻 的 数据 通信 科学 贡献 很 多 , 但 是 该 技术 已 经 完成 了 它 的 使 命 。 在 绝 大 多 
数 装置 中 ， 它 已 经 被 开放 的 因特网 协议 所 替代 。 


12. 3 早期 的 学 术 和 科研 网 络 : 因特网 的 根源 和 体系 结构 
冷战 时 期 ， 在 偏远 的 科研 机 构 中 美国 科学 家 在 政府 的 资助 下 努力 工作 ， 试 图 保持 美国 的 军 
事 优势 。 当 美国 在 技术 竞赛 中 已 经 落后 时 ， 美 国政 府 创 建 了 一 个 名 为 高 级 研究 计划 局 ( ARPA) 
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的 组 织 。 然 而 ， 为 了 完成 工作 这 个 组 织 需要 的 复杂 计算 机 是 罕见 和 极端 昂贵 的 ， 甚 至 用 五 角 大 
楼 的 标准 衡量 仍然 很 昂贵 。 不 久 ， 有 人 想到 建立 通信 链 路 以 连接 分 散在 美国 各 地 的 几 台 超级 计 
算 机 ， 计 算 资 源 可 以 由 无 数 具 有 相似 目的 的 研究 者 共享 。 此 外 ， 这 个 网 络 被 设计 有 足够 的 宛 
余 ， 即 使 核 战 争 打 掉 了 大 量 的 节点 或 通信 线路 仍 可 以 提供 连续 的 通信 。 为 此 ，1968 年 12 月 位 
于 马萨诸塞 州 剑桥 的 一 家 称 为 BBN 的 咨询 公司 (现在 的 Cenuity Corporation ) 签 下 了 建造 这 样 一 
个 网 络 的 合同 。1969 年 12 月 ， 犹 他 州 大 学 、 加 州 大 学 洛杉矶 分 校 、 加 州 大 学 圣 塔 芭 芭 拉 分 校 
和 斯 坦 福 研究 所 4 个 节点 上 网 。ARPA 网 逐渐 扩大 到 了 更 多 的 政府 和 研究 机 构 中 。 当 里 根 总 统 
把 ARPA 的 名 字 改 为 国防 高 级 研究 计划 局 ( DARPA) 后 ，ARPA 网 变 成 了 DARPA 网 。( 译 者 注 : 
Defense Advanced Research Projects Network 应 为 Defense Advanced Research Projects Agency。 )20 世 
纪 80 年 代 初 ， 节 点 以 每 个 月 增加 一 个 多 一 点 的 速率 增长 。 然 而 ， 军 方 研究 人 员 最 终 放弃 了 
DARPA 网 ， 以 更 安全 的 网 络 来 替代 它 。 





1985 年 ， 美 国 国家 科学 基金 会 (NSF) 建 立 了 自己 的 网 络 NFS 网 ， 以 支持 科学 和 学 术 研 究 。 
NFS 网 和 DARPA 网 服务 于 相似 的 目标 和 相似 的 用 户 群 体 ,但 是 NSF 网 的 容量 超过 了 DARPA 
网 。 因 此 ， 当 军队 放弃 了 DARPA 网 时 ，NSF 网 接收 了 DARPA 网 ， 成 为 了 我 们 现在 所 了 解 的 因 
特 网 。20 世纪 90 年 代 初 ，NSF 网 已 经 不 能 满足 NSF 的 使 用 了 ， 所 以 开始 建造 更 快 、 更 可 靠 的 
NSF 网 。 公 共 因 特 网 的 管理 交 给 了 私人 、 国 家 和 地 区 的 企业 ， 如 Sprint 、MCI 和 PacBell 等 一 些 
企业 。 这 些 公 司 买 了 NSF 网 的 骨干 网 ， 并 出 售 骨 干 网 容量 给 各 种 因特网 服务 提供 商 ( 1SP) 
赚钱 。 





原来 的 DARPA 网 (也 就 是 现在 的 因特网 ) 将 在 热 核 战争 中 幸存 下 来 。 因 为 ， 不 像 20 世纪 
70 年 代 存 在 的 所 有 其 他 网 络 ，DARPA 网 在 系统 之 间 没 有 专用 的 连接 。 取 而 代 之 的 是 信息 沿 着 
所 有 可 以 获得 的 路 径 传播 。 同 属于 一 个 会 话 的 数据 流 的 各 个 部 分 能 够 从 不 同 的 路 径 到 达 目 的 
地 。 健 壮 性 的 关键 是 数据 报 消 息 包 的 想法 ， 消 息 包 用 数据 块 的 方式 携带 数据 ， 代 替 了 SNA 模 
型 使 用 的 数据 流 方式 。 每 个 数据 报 都 有 地 址 信息 ， 因 此 ， 每 个 数据 报 都 可 以 作为 一 个 独立 的 单 
元 来 传送 。 

DARPA 网 的 第 二 个 革命 性 成 果 是 创立 了 一 种 统一 的 协议 ， 用 于 网 络 上 不 同 速度 的 不 同 主 
机 之 间 的 通信 。 因 为 DARPA 网 连接 了 很 多 不 同类 型 的 网 络 ， 所 以 DARPA 网 称 为 互连网 络 。 按 
照 原来 的 说 明 ， 主 机 使 用 接口 消息 处 理 器 (IMP) 连接 到 DARPA 网 。IMP 负责 DARPA 网 的 语言 
到 本 地 主机 系统 通信 语言 之 间 的 协议 翻译 ， 所 以 在 IMP 和 主机 之 间 能 够 使 用 任何 通信 协议 。 今 
天 ， 路 由 器 (将 在 12. 6.7 节 中 讨论 ) 已 经 替代 了 IMP， 并 且 与 20 世纪 70 年 代 相 比 通信 协议 的 
异 构 性 更 小 了 。 然 而 ， 基 本 原理 仍然 相同 ， 互 连 网 络 的 概念 已 经 变 为 因特网 事实 上 的 同义词 
了 。 图 12-2 所 示 的 是 一 种 现代 互连网 络 的 配置 。 这 张 图 显示 了 4 个 路 由 器 是 如 何 形成 网 络 核 
心 的 。 它 们 连接 许多 不 同类 型 的 设备 ， 自 己 决定 数据 报 走 哪 条 路 可 能 是 最 有 效 的 。 
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图 12-2 一 个 互连网 络 的 示例 


因特网 不 仅 是 一 组 良好 的 数据 通信 规范 ， 它 也 许 是 一 门 哲学 。 这 门 哲 学 最 重要 的 原则 是 建 
立 一 个 自由 和 开放 的 信息 共享 世界 ， 这 个 世界 的 命运 正在 由 人 们 和 它 的 理念 共同 塑造 。 这 种 开 
放 性 的 缩影 是 创建 因特网 标准 的 方式 。 因 特 网 标准 是 通过 一 个 民主 过 程 构想 出 来 的 ， 整 个 过 程 
是 在 因特网 架构 委员 会 (IAB) 的 主持 下 进行 的 ， 而 因特网 架构 委员 会 本 身受 非 营利 组 织 因 特 网 
协会 (ISOC ) 的 监督 。 因 特 网 架构 委员 会 下 的 因特网 工程 任务 组 (IETF ) 是 一 个 松散 的 行业 专家 
联盟 ， 负 责 开 发 因特网 协议 的 详细 规范 。 因 特 网 工程 任务 组 以 置 评 请 求 ( RFC ) 的 形式 发 布 所 
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有 提议 的 标准 ， 这 种 发 布 形式 对 于 任何 的 审查 和 评论 都 是 开放 的 。 两 个 最 重要 的 置 评 请 求 RFC 
791( 因特网 协议 第 4 版 ) 和 RFC 793( 传输 控制 协议 ) ， 形 成 了 今天 的 全 球 因特网 的 基础 。 

在 很 多 委员 会 的 管理 下 所 有 的 ISOC 委员 会 可 能 已 经 有 了 官僚 主义 ， 因 此 产生 了 不 可 思议 
的 和 令 人 费解 的 规格 说 明 。 但 由 于 整个 过 程 的 开放 性 ， 以 及 天 才 的 评论 者 ， 使 得 RFC 在 整个 
网 络 化 文献 中 成 为 最 清晰 和 最 可 读 的 文档 。 难 怪 制造 商会 如 此 迅速 地 采用 因特网 协议 。 因 特 网 
协议 现在 运行 于 所 有 规格 的 网 络 上 ， 无 论 是 公有 还 是 私有 的 网 络 。 以 前 ， 网 络 标准 是 由 一 个 集 
中 委员 会 或 一 个 设备 供应 商 正 式 发 布 。ISO/OSI 协议 模型 就 是 用 这 种 方式 产生 的 ， 我 们 下面 讨 
论 这 个 协议 。 


12.4 网 络 协议 1: ISO/OSI 统一 协议 

在 第 13 章 中 ， 我 们 会 展示 各 种 数据 存储 接口 如 何 使 用 协议 栈 。SCSI-3 架构 模型 是 其 中 之 
一 。 通 常 ， 协 议 栈 使 各 种 接口 具有 可 移植 性 、 可 维护 性 和 易 描述 性 。 其 中 最 重要 和 最 全 面 的 是 
ISOZOSI( 国际 标准 化 组 织 / 开 放 系 统 互 连 ) 协 议 栈 。ISOLOSI 协议 本 是 许多 存储 、 数 据 通信 接口 
和 协议 的 理论 模型 。 虽 然 每 个 协议 在 实现 细节 上 不 同 , 但 是 基本 思想 是 相同 的 : 协议 的 每 一 层 
只 与 相 邻 的 层 有 接口 ， 不 允许 跳 层 。 协 议会 话 发 生 在 两 台 不 同 机 器 上 的 同一 协议 层 之 间 。 发 生 
在 协议 会 话 中 的 这 种 通信 的 具体 方式 在 国际 标准 中 有 明确 的 定义 。 

在 20 世纪 70 年 代 末 ， 几 乎 每 个 计算 机 制造 商都 设计 了 专 有 的 通信 协议 。 有 时 这 些 协议 的 
发 明 者 会 保密 细节 ， 以 确保 锁定 其 产品 销售 的 市 场 。 厂 家 A 的 设备 不 能 与 厂家 B 的 设备 通信 ， 
除非 在 两 个 系统 之 间 放 置 协议 转换 设备 ( 黑 盒 ) 。 尽 管 那样 ， 黑 盒 也 不 能 像 预 期 的 那样 工作 ， 
通常 是 因为 在 黑 盒 做 好 之 后 ， 厂 家 又 更 改 了 一 些 协议 参数 。 

世界 上 两 个 最 主要 的 标准 化 机 构 意 识 到 了 这 座 巴 别 塔 正在 变 得 越 来 越 昂 贵 ， 这 最 终 会 阻碍 
信息 共享 的 发 展 。 在 20 世纪 70 年 代 末 和 80 年 代 初 ， 国 际 标准 化 组 织 (ISO) 和 电话 电报 国际 咨 
询 委员 会 (CCITT) 分 别 试图 创建 一 个 国际 标准 电信 架构 。1984 年 ， 这 两 个 组 织 走 到 一 起 共同 创 
建 一 个 统一 的 模型 ， 现 在 称 为 1SO 开放 系统 互 连 参考 模型 (ISO/IEC RM) 。( 在 这 个 情景 下 开 
放 系 统 ， 意 味 着 系统 连通 性 将 不 专属 于 任何 一 个 厂商 。) ISO 的 工作 成 为 了 一 种 参考 模型 ， 因 为 
几乎 没有 商业 系统 精确 地 使 用 过 模型 中 说 明 的 所 有 特性 。 然 而 ，ISOAOSI 模型 确实 有 助 于 理解 
真实 协议 和 网 络 部 件 在 标准 模型 中 是 如 何 组 合 在 一 起 的 。 

0SI 参考 模型 包含 7 个 协议 层 ， 从 第 一 层 的 物理 介质 互 连 开始 ， 到 第 七 层 的 应 用 程序 。 必 
须 强 调 的 是 OSI 模型 定义 的 仅 是 七 层 中 每 一 层 的 功能 和 层 与 层 之 间 的 接口 。 模 型 中 没有 实现 细 
节 。 包括 正 EE 、 欧 洲 计算 机 制造 商 协会 (ECMA) 、 国 际 电信 联盟 电信 标准 化 部 门 (ITU-T) 和 
ISO 本 身 (ISO 模型 外 部 ) 在 内 的 许多 不 同 的 标准 化 组 织 ， 已 经 提供 了 这 样 的 细节 。 最 高 层 的 实 
现 可 以 完全 由 用 户 定义 。 


12. 4. 1 一 个 小 故事 


在 开始 讨论 0SI 参考 模型 技术 之 前 ， 让 我 们 用 一 个 小 故事 说 明 分 层 协议 如 何 工 作 。 假 如 你 
和 你 的 姐姐 打赌 输 了 ， 你 要 帮 她 带 一 天 她 的 孩子 比 利 。 比 利 是 一 个 宠 坏 的 孩子 ， 当 他 的 要 求 得 
不 到 满足 时 ， 他 就 会 大 发 脾气 。 今天， 他 已 经 决定 想 吃 街 边 熟食 店 的 烤 牛 肉 三 明治 。 这 个 烤 牛 
肉 三 明治 一 定 要 加 芥末 和 泡菜 ， 什 么 也 不 能 多 ,什么 也 不 能 少 。 

一 进 熟 食 店 ， 你 让 比 利 坐 下 来 ， 然 后 从 柜台 旁边 的 自动 取 号 机 上 取 一 个 号 。 有 一 个 收银 员 
接受 订单 ， 男 外 一 个 人 在 一 个 食物 准备 区 按照 订购 准备 食物 。 熟 食 店 午餐 时 间 挤 满 了 饥饿 的 工 
人 。 你 自 言 自 语 道 :“ 今 天 的 服务 好 像 慢 得 出 奇 。 比 利 开 始 大 声 喊 他 俄 了 ， 同 时 他 把 小 拳头 手 
在 桌子 上 。 





448 ”第 12 章 








不 管 你 多 想 要 比 利 的 三 明治 ， 都 要 等 着 叫 号 ， 因 为 你 正在 遵守 一 个 协议 ， 所 以 你 不 能 加 
塞 。 事实 上 ， 如 果 违 反 协议 ,你 可 能 会 被 赶 出 熟食 店 ， 这 样 使 事情 变 得 更 糟 。 

当 终 于 轮 到 你 到 柜台 前 时 ( 比 利 现在 正在 大 声 喊 叫 )， 你 把 订单 给 收银 员 ， 为 自己 增加 一 
个 金枪鱼 三 明治 和 暮 条 。 收 银 员 给 你 取 饮 料 并 告诉 厨师 准备 一 份 金枪鱼 三 明治 和 一 份 配 芥 末 和 
泡菜 的 烤 牛肉 三 明治 。 虽 然 厨 师 能 够 在 嘲 杂 声 中 听 到 比 利 叶 着 要 吃 午饭 的 每 句 话 ， 但 是 她 一 直 
等 到 收银 员 告诉 她 要 准备 什么 时 才 开 始 工 作 。 

因此 ， 比 利 不 管 怎样 大 声 叫喊 ， 都 不 能 跳 过 熟食 店 协议 的 收银 员 层 。 在 准备 三 明治 之 前 ， 
厨师 必须 知道 真正 的 订单 并 且 顾 客 愿 意 为 此 付 账 。 这 些 信 息 只 能 由 收银 员 告 诉 她 。 

一 且 三 明治 准备 好 了 ， 厨 师 就 会 用 熟食 店 的 包装 纸 分 别 打包 ， 然 后 在 纸 上 标 明 每 个 包 内 是 
哪 种 三 明治 。 收 银 员 取 来 三 明治 ， 把 它们 连同 苗条 和 两 缸 可 乐 放 和 棕色 的 袋子 。 她 说 账单 是 
6. 25 美元 ， 你 递 给 她 一 张 10 美元 的 钞票 ， 她 找 给 你 4. 75 美元 。 由 于 她 找 错 了 钱 ， 所 以 你 一 直 
站 在 柜台 前 直到 把 钱 找 对 ， 然 后 你 走 到 桌 边 。 

打开 三 明治 后 ， 比 利 发 现 他 的 烤 牛肉 三 明治 实际 上 是 咸 牛 肉 三 明治 ， 这 又 触发 了 另 一 轮 的 
抱怨 。 你 除了 再 去 拿 一 个 号 ， 然 后 等 着 按 顺 序 叫 号 外 ， 没 有 别 的 选择 。 

钱 找 错 了 ， 你 没有 离开 柜台 ， 类 似 于 发 生 在 协议 层 之 间 的 错误 检查 。 在 接收 层 对 发 送 层 发 
来 的 信息 表示 满意 之 前 ， 传 输 不 会 进行 。 当 然 ， 当 你 站 在 柜台 边 时 ,就 打开 比 利 的 三 明治 查 
看 ， 你 会 感觉 不 合适 (毕竟 ， 那 样 做 会 让 人 讨厌 ) 。 

这 些 三 明治 连同 它们 的 包装 ， 相 当 于 0SI 协议 数据 单元 (PDU)。 一 旦 数据 被 上 层 协议 封 
装 ， 低 层 协 议 将 不 能 检查 其 中 的 内 容 。 不 论 你 或 者 收银 员 都 不 会 打开 三 明治 的 包装 。 当 收银 员 
把 你 要 食物 放 到 袋子 中 时 ， 也 创建 了 另 一 个 协议 数据 单元 。 因 为 食物 在 袋子 里 ， 所 以 你 能 够 很 
容易 地 把 它 带 到 你 的 桌子 上 。 可 以 想象 ， 如 果 一 手 拿 着 两 钠 可 乐 ， 一 手 拿 着 两 个 三 明治 ， 还 要 
再 拿 着 一 包 区 条 ， 然 后 穿 过 拥挤 的 熟食 店 ， 确 实 很 有 可 能 会 失手 弄 掉 食物 。 

在 这 个 熟食 店 里 ， 你 知道 如 果 想 吃饭 ， 那 么 你 不 能 直接 找 厨 师 ， 也 不 能 找 别 的 顾客 ， 也 不 
能 找 维修 人 员 。 要 吃 午 饭 ， 你 只 能 在 拿 完 号 后 去 找 收银 员 。 你 从 自动 取 号 机 中 拿 的 号 ， 类 似 于 
一 个 OSI 服务 访问 点 (SAP) 。 只 有 当 你 拿 着 证 明 你 是 下 一 个 排队 者 的 这 个 号 时 ， 收 银 员 才 会 接 
受 你 的 订单 。 


12. 4.2 ”OSI 参考 模型 


0SI 参考 模型 如 图 12-3 所 示 。 正 如 你 所 看 到 的 ， 这 个 协议 由 7 层 组 成 。 相 邻 层 之 间 通 过 
SAP 接口 ， 当 协议 数据 单元 通过 协议 栈 时 ， 每 个 协议 层 都 添加 或 删除 自己 的 报头 。 在 发 送 端 添 
加 报头 ， 在 接收 端 删除 报头 。 协 议 数据 单元 中 的 内 容 在 对 话 双方 的 对 等 层 之 间 创 建 了 一 个 会 
话 。 这 个 会 话 是 它们 的 协议 。 

前 面 曾 经 用 一 个 故事 解释 了 PDU 和 SAP 的 思想 ， 我 们 再 用 一 个 隐喻 进一步 解释 OSI 参考 
模型 。 在 这 个 隐喻 中 ,假设 你 在 经 营 自己 的 生意 。 这 个 生意 名 为 “超级 汤 和 美味 茶 ”， 它 生产 
美味 的 汤 和 茶 ， 销 往 北美 洲 各 地 的 不 同 口 味 的 人 。 为 了 把 你 的 美味 商品 运 到 各 地 ， 你 使 用 了 一 
家 名 为 GL&P 的 私人 船 运 公司 。 商 品 制造 和 最 终 的 消费 系统 之 间 跨 越 了 一 系列 过 程 ， 类 似 于 
0SI 参考 模型 的 层 执行 过 程 ， 这 些 我 们 将 在 随后 章节 中 看 到 。 

OSI 物理 层 

许多 不 同 种 类 的 介质 都 能 在 通信 源 ( 发 起 者 ) 和 目的 地 (应 答 者 ) 之 间 传 送 二 进 制 信息 。 不 
论 发 起 者 还 是 应 答 者 都 不 需要 关心 它们 的 会 话 是 发 生 在 铜 线 、 卫 星 链 路 还 是 光缆 上 。0SI 模型 
的 物理 层 承担 从 这 里 到 那里 传送 信号 的 工作 。 它 从 上 面 的 数据 链 路 层 接收 二 进 制 信息 流 ， 并 对 
这 些 二 进 制 信息 编码 ， 然 后 根据 约定 的 协议 和 信号 标准 把 这 些 信 息 放置 在 通信 介质 上 。 


网 络 的 组 成 和 体系 结构 
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应 用 层 协 议 数据 单元 





会 话 层 协 议 数据 单元 


”数据 链 路 层 










编码 、 电 压 、 线 路 、 
信和 号、 驱动 等 JUUL-- 





帧 尾 定 界 符 和 用 户 应 用 层 表示 层 会 话 层 | 传输 层 | 网 络 层 向 据 链 路 层 | 开始 定 
错误 校正 数据 报头 报头 报头 报头 报头 报头 界 符 


图 12-3 OSI 参考 模型 (垂直 接口 操作 ， 水 平 协议 操作 ) 
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OSI 物理 层 的 功能 可 以 与 GL&P 船 运 公司 把 产品 从 工厂 运 到 客户 那里 的 车 辆 相 比 较 。 在 把 
你 的 包 庄 交 给 运输 公司 后 ， 你 通常 就 不 用 关心 包 右 是 用 火车 、 卡 车 、 飞 机 还 是 轮船 运 到 目的 地 
了 ， 只 要 包 右 能 完好 并 且 在 适当 的 时 间 内 到 达 目 的 地 即 可 。 沿 途 的 工作 人 员 毫 不 关心 包 庄 里 的 
东西 ， 只 关心 箱子 上 的 地 址 (有 时 甚至 忽略 “ 易 碎 "等 字 ) 。 就 像 货运 公司 搬运 箱子 的 方式 ，OSI 
物理 层 搬运 传输 帧 ， 有 时 传输 帧 称 为 物理 层 协 议 数据 单元 ， 或 者 物理 PDU。 每 个 物理 PDU 携 
人 带 一 个 地 址 和 有 分 隔 符 的 信号 模式 ， 这 个 模式 围绕 着 PDU 中 的 有 效 载荷 或 内 容 。 

OSI 数据 链 路 层 

当 你 寄 包 庄 的 时 候 ， 会 把 物品 放 入 合适 的 货运 包装 箱 内 并 处 理 包 装 的 操作 ， 与 0SI 数据 链 
路 层 的 功能 相当 。 数 据 链 路 层 把 消息 字 节 组 织 到 沿 着 物理 介质 传输 的 大 小 合适 的 帧 中 。 如 果 你 
想 运输 50kg 的 汤 和 茶 ， 同 时 GL&P 公司 有 一 个 规定 包 庄 质量 不 能 超过 40kg， 那 么 你 至 少 需要 
两 个 运 物品 的 箱子 。 数 据 链 路 层 做 相同 的 事情 。 它 与 另 一 端的 数据 链 路 层 协商 帧 的 大 小 和 发 送 
帧 的 速度 。 

帧 传输 的 时 序 被 称 为 流 控制 。 如 果 帧 发 送 得 太 快 ， 则 接收 方 的 缓冲 区 可 能 会 溢出 ， 导 致 丢 
帧 。 如 果 帧 发 送 的 速度 达 不 到 要 求 ， 则 接收 方 可 能 会 超时 和 断 开 连接 。 在 这 两 种 情况 下 ， 当 接 
收 方 在 规定 的 时 间 间 隔 内 没有 确认 这 个 包 ， 数 据 链 路 层 就 会 感知 到 这 个 问题 。 缺 少 这 个 确认 ， 
发 送 方 就 会 重新 传输 这 个 包 。 

OSI 网 络 层 

假设 你 可 以 告诉 GL&P 公司 ,要 通过 新 泽 西 的 纽 岂 克 发 送 这 些 包 庄 ， 因 为 纽约 的 站 场 总 
是 太 拥挤 了 ， 无 法 按时 拿 到 我 的 包 里 。 换 一 种 说 法 ， 如 果 你 可 以 告诉 货运 公司 运送 你 的 包 
庄 走 哪 条 路 ， 那 么 你 所 执行 的 功能 与 0SI 模型 的 网 络 层 相 同 。 然 而 ， 在 费城 站 场 的 包 右 操作 
者 也 可 能 执行 网 络 层 的 功能 ， 假 如 他 们 了 解 到 纽约 出 现 了 非 同 寻常 的 问题 ， 所 以 决定 让 这 
个 包 右 改 走 纽 瓦 克 。 这 种 局 部 决策 是 每 个 大 型 互联 网 络 运行 的 关键 。 由 于 大 多 数 网 络 都 是 
很 复杂 的 ， 每 个 终端 计算 机 都 不 可 能 追踪 到 每 个 目的 地 的 每 条 可 能 的 路 线 ， 所 以 网 络 层 的 
功能 遍布 整个 网 络 。 

在 源 计算 机 中 ， 网 络 层 除 了 向 从 传输 层 传 来 的 PDU 中 添加 地 址 信息 之 外 ,不 做 其 他 的 事 
情 ， 然 后 将 它们 传递 到 数据 链 路 层 。 当 移动 PDU 跨 过 中 间 节 点 时 ， 这 些 中 间 节 点 就 像 网 络 中 
9 货运 站 场 ， 网 络 层 做 最 重要 和 最 复杂 的 任务 。 网 络 层 不 仅 建立 路 径 ， 而 且 还 要 保证 PDU 的 
大 小 适合 于 源 节 点 到 目的 节点 之 间 的 所 有 设备 。 

OSI 传输 层 

比如 ， 装 满 缸 头 汤 和 包装 茶 包 庄 的 目的 地 是 魁北克 的 一 个 食品 配送 仓库 。 当 包 庄 到 达 时 ， 
仓库 管理 员 打开 包装 ， 确 保 货 物 在 运输 过 程 中 没有 损坏 。 她 打开 每 个 箱子 ， 寻 找 有 凹 痕 的 把 头 
和 破损 的 茶 盒 。 她 不 在 乎 汤 太 咸 或 茶 太 酸 ， 她 只 关心 产品 是 否 完好 无 损 的 到 达 。 一 旦 货物 通过 
了 检验 ， 管 理 员 会 签 一 个 GL&P 公司 返回 给 你 的 收据 ， 让 你 知道 你 的 产品 到 达 了 目的 地 。 

与 此 类 似 ，0SI 传输 层 为 协议 栈 中 处 于 它 上 面 的 层 提 供 质量 保障 功能 。 通 过 与 连接 另外 一 
端的 传输 层 的 握手 ， 有 助 于 另 一 个 层 的 端 到 端的 确认 和 错误 改正 。 传 输 层 是 OSI 模型 中 能 够 感 
知 到 网 络 或 协议 状况 的 最 低层 。 一 旦 传输 层 把 传输 层 协议 信息 与 会 话 层 PDU 和 剥离， 会话 层 就 
可 以 安全 地 假定 在 PDU 中 没有 由 网 络 引起 的 错误 。 

OSI 会 话 层 

会 话 层 仲裁 两 个 通信 节点 之 间 的 对 话 ， 并 在 需要 的 时 候 开启 和 关闭 对 话 。 它 控制 方向 和 模 
式 ， 即 为 半 双 工 或 全 双 工 。 半 双 工 是 指 一 次 只 在 一 个 方向 上 传送 信息 ， 全 双 工 是 指 可 以 同时 在 
两 个 方向 上 传送 信息 。 如 果 模 式 是 半 双 工 的 ， 那 么 会 话 层 决定 哪个 节点 控制 通信 线路 。 它 还 提 
供 文件 传输 期 间 的 恢复 检查 点 。 每 次 一 个 数据 包 或 数据 块 在 收 到 确认 完好 后 就 会 发 送 给 检查 
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点 。 如 果 一 个 大 文件 在 传输 过 程 中 出 现 错误 ， 那 么 会 话 层 从 最 后 一 个 检查 点 重 发 所 有 的 数据 。 
如 果 不 设 置 检查 点 ， 那 么 就 需要 重 传 整个 文件 。 

如 果 仓 库 管 理 员 注意 到 一 个 箱子 在 运输 途中 破损 了 ， 那 么 她 会 通知 你 (以 及 GL&P 公司 ) 货 
物 没有 完整 到 达 ， 你 必须 另外 寄 一 批 货 物 。 如 果 损 坏 的 是 50kg 货物 中 的 那个 10kg 的 箱子 ， 你 
只 需要 替换 10kg 箱子 中 的 货物 ; 另外 40kg 的 货物 可 以 送 给 消费 者 。 

OSI 表示 层 

如 果 你 的 消费 者 住 在 魁北克 市 场 区 ， 饶 头 上 的 标签 只 有 英文 该 怎么 办 ” 如果 想 把 汤 卖 给 说 
法 语 的 人 ， 那 么 你 肯定 希望 你 的 汤 镀 头 有 双语 标签 。 如 果 魁 北 克 食品 配送 仓库 的 员工 为 你 做 了 
这 件 事 ， 那 么 他 们 所 做 的 工作 就 是 在 OSI 模型 中 表示 层 所 要 做 的 工作 。 

表示 层 为 上 面 的 应 用 层 提供 高 级 数据 解释 服务 。 例 如 ， 假 设 一 个 网 络 节点 是 一 台 IBM 
zSeries 服务 器 ， 它 是 以 EBCDIC 码 存储 和 传输 数据 的 。 这 个 大 型 机 服务 器 需要 发 送 一 些 数据 到 
一 台 请 求 数据 是 基于 ASCII 码 的 微型 计算 机 上 。 两 个 系统 的 表示 层 会 决定 谁 将 执行 EBCDIC 码 
到 ASCII 码 的 转换 。 任 何 一 方 都 可 以 做 这 项 工作 ， 并 且 效 果 相 同 。 重 要 的 是 要 记 住 ， 主 机 发 送 
EBCDIC 码 到 它 的 应 用 层 ， 而 客户 端的 应 用 层 从 位 于 协议 栈 下 面 的 表示 层 中 接收 ASCI 码 。 如 
果 在 通信 会 话 中 使 用 加 密 或 某 些 类 型 的 数据 压缩 ， 那 么 也 会 调用 表示 层 服务 。 

OSI 应 用 层 

应 用 层 在 通信 的 一 端 向 用 户 提供 有 意义 的 信息 和 服务 ， 并 在 通信 的 另 一 端 与 系统 资源 ( 程 
序 和 数据 文件 ) 进行 接口 。 应 用 层 提供 了 一 组 程序 ， 当 用 户 认为 合适 时 可 以 调用 它们 。 如 果 应 
用 层 提供 的 常规 应 用 程序 都 不 能 完成 某 项 工作 ， 则 还 可 以 编写 自己 的 应 用 程序 。 在 通信 方面 ， 
这 些 应 用 程序 唯一 需要 做 的 事情 是 向 表示 层 服务 访问 点 发 送 消息 ， 困 难 的 部 分 由 更 低层 负责 
处 理 。 

为 了 享受 美味 的 汤 ， 喜 欢 喝 汤 的 法 裔 加 拿 大 人 需要 做 的 只 是 打开 镀 头 、 加 热 和 享受 。 因 为 
GL&P 公司 和 区 域 食品 经 销 商 已 经 做 了 所 有 的 工作 ， 所 以 你 的 汤 在 加 拿 大 人 和 餐桌 上 的 味道 就 像 
从 你 厨房 里 刚 端 出 来 的 一 样 可 口 。( 无 限 精彩 !) 


12.5 网 络 协议 中: TCP/IP 网 络 体系 结构 

当 ISO 和 CCITT 还 在 完善 协议 栈 的 细节 上 面 争 论 不 休 时 ，TCP/IP 迅速 蔓延 全 球 。 由 于 
TCP/IP 在 学 术 和 科学 领域 具有 的 广泛 影响 力 ， 所 以 TCP/IP 已 悄然 成 为 事实 上 的 全 球 数据 通信 
标准 。 


然 开始 时 并 不 是 这 样 ,但 是 TCP/IP 现 
虽然 开始 时 并 不 是 这 样 ,但 是 岗 在 pp 


却 是 一 个 精简 和 有 效 的 协议 栈 。 它 有 三 层 ， 每 层 超 文本 传输 协议 、 


以 映射 到 OSI 模型 七 层 协议 妓 。 12-4 示 远程 登录 、 简 单 
可 以 映射 到 OSI 模型 七 层 协议 的 五 层 。 在 图 人 


中 显示 了 这 些 层 。 因 为 ， 卫 层 与 0SI 的 数据 链 路 
层 和 物理 层 松 耦 合 ， 所 以 TCP/IP 可 以 用 于 任何 
类 型 的 网 络 ， 甚 至 是 在 一 个 会 话 中 使 用 不 同类 型 
的 网 络 。 唯 一 的 要 求 是 所 有 参与 的 网 络 至 少 必须 
运行 因特网 协议 第 4 版 (IPv4) 。 

现在 ， 有 两 个 版 本 的 因特网 协议 在 使 用 : 第 
4 版 和 第 6 版 。IPv6 解决 了 许多 IPv4 的 限制 。 尽 
管 IPv6 有 许多 优点 ,但 IPv4 的 庞大 安装 量 确保 “图 12-4 TCP/ 正 协议 栈 与 0SI 协议 栈 的 比较 
了 它 将 在 未 来 的 许多 年 里 将 会 得 到 支持 。IPv4 和 IPv6 之 间 的 一 些 主要 不 同 将 在 12. 5.5 节 介绍 。 
下 面 先 来 详细 了 解 IPv4。 
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12.5.1 IPv4 


TCP/IP 协议 栈 的 中 层 提供 了 与 OSI 参考 模型 的 网 络 层 和 数据 链 路 层 基 本 相同 的 服务 : 它 
将 TCP 包 分 成 名 为 数据 报 的 协议 数据 单 
元 ， 然 后 附 上 使 数据 报到 达 目 的 地 所 需要 
的 路 由 信息 。 数 据 报 的 概念 是 ARPA 网 以 
及 现在 因特网 健壮 性 的 基础 。 数 据 报 在 没 
有 网 络 管理 人 员 干 预 的 情况 下 ， 可 以 采取 
任何 可 行 的 路 径 。 以 图 12-5 所 示 的 网 络 为 
例 ， 如 果 中 间 节 点 X 拥塞 或 失效 ,那么 中 
间 节 点 站 可 以 让 数据 报 通过 节点 Z， 直 到 
节点 X 恢复 到 全 速 为 止 。 路 由 器 是 因特网 
中 最 关键 的 组 件 ， 研 究 人 员 正 在 不 断 寻求 
提高 其 有 效 性 和 性 能 的 方法 。 在 12. 6.7 节 
中 将 会 看 到 路 由 器 的 详细 介绍 。 图 12-5 在 IP 中 的 数据 报 路 由 

构成 任何 TCP/IP 协议 数据 单元 的 字 节 都 称 为 八 位 位 组 。 这 是 因为 在 设计 ARPA 网 协议 时 ， 
字 节 (byte) 这 个 词 被 认为 是 IBM 大 型 机 表示 8 位 二 进 制 数 的 专用 词 。 大 多 数 TCP/IP 文献 都 使 
用 入 位 位 组 (octet) 这 个 词 , 但 是 为 了 清楚 起 见 ， 本 书 使 用 字 节 这 个 词 。 


IPv4 数据 报头 








生存 时 间 2 
a 报头 校 验 和 





源 IP 地 址 





目标 IP 地 址 





PP 选项 ( 10 ~ 40 字 节 ) 





数据 





每 个 IPv4 数据 报 必 须 至 少 包含 40 字 节 ， 包 括 24 字 节 报头 ， 如 上 图 所 示 。 水 平行 表示 32 
位 字 。 例 如 ， 从 上 图 中 可 以 看 到 ， 服 务 类 型 字段 使 用 报头 的 第 8 位 ~ 第 15 位 ,而 报 文 标识 字 
段 使 用 第 32 位 ~ 第 47 位 。 填 充 字段 是 报头 的 最 后 一 个 字段 ， 从 而 确保 跟 在 报头 后 面 的 数据 能 
够 从 一 个 32 位 的 偶数 边界 上 开始 。 填 充 字段 填充 的 都 是 零 。 在 IPv4 报头 中 其 他 字段 是 : 

e 版 本 说 明 使 用 的 IP 协议 版 本 。 版 本 号 会 显示 传输 路 径 上 所 有 数据 报 的 长 度 和 报头 

字段 中 所 要 求 的 内 容 。 对 于 IPv4， 这 个 字段 总 是 0100( 因为 0100, =4io) 。 
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e 报头 长 度 一 一 在 32 位 字 中 给 出 报头 的 长 度 。IP 报头 的 长 度 是 可 变 的 ， 这 与 他 可 选 字 
段 的 值 有 关 ， 但 是 对 于 一 个 正确 报头 来 说 ， 其 最 小 值 是 15。 

。 服务 类 型 一 一 控制 由 中 间 节 点 提供 的 数据 报 优先 级 。 其 取 值 范围 从 “常规 ”(000) 到 
“关键 ”(101)。 网 络 控制 数据 报 用 110 和 111 表示 。 

e 总 长 度 一 一 以 字 节 形式 给 出 整个 IP 数据 报 的 长 度 。 从 上 面 的 布局 图 中 可 以 看 出 ， 为 总 
长 度 预 留 了 2 字 节 。 因 此 ， 人 允许 的 最 大 IP 数据 报 是 2" -1 或 者 65 535。 

。 报 文 标识 一 一 按照 放置 到 网 络 上 的 顺序 ， 给 每 个 数据 报 分 配 一 个 序列 号 。 主 机 标识 和 
报 文 标识 的 组 合 唯一 地 标识 了 每 一 个 存在 的 IP 数据 报 。 

。 标志 一 一 说 明 数 据 报 是 否 可 以 由 中 间 节 点 分 段 ( 分 成 更 小 的 数据 报 )。IP 网 络 必须 能 够 
处 理 至 少 576 字 节 的 数据 报 。 大 多 数 IP 网 络 能 够 处 理 大 约 8KB 长 的 报 文 。 例 如 ， 带 有 
“不 分 段 ” 位 组 的 一 个 8KB 数据 报 不 会 选择 只 能 处 理 2KB 报 文 的 网 络 。 











。 分 段 偏 移 量 一 一 指示 在 某 个 数据 报 中 一 个 分 段 的 位 置 。 也 就 是 说 ， 它 说 明 这 个 数据 报 
的 某 个 部 分 来 自 于 哪里 。 


e 生存 时 间 (TTL) 一 一 TIL 最 初 的 目的 是 测量 数据 报 保持 有 效 的 时 间 。 如 果 一 个 数据 报 
进入 到 路 由 环 路 中 ， 那 么 在 数据 报 可 能 导致 拥塞 之 前 ，TTL( 理 论 上 ) 就 会 过 期 。 在 实 
践 中 ， 数 据 报 每 通过 一 个 中 间 网 络 节点 时 ，TTL 字段 就 会 递减 ， 所 以 这 个 字段 并 不 真 
正 测 量 数据 报 的 秒 数 ， 而 是 测量 在 它 到 达 目 标 之 前 允许 的 跳 数 。 

协议 号 一 一 说 明 高 层 协 议 正在 发 送 的 数据 所 允许 的 报头 。 这 个 字段 中 的 几 个 重要 值 是 : 

0= 保 留 

1 = 因特网 控制 消息 协议 (ICMP) 

6= 传 输 控制 协议 (TCP) 

17 = 用 户 数据 报 协议 LUDP) 

TCP 将 在 12.5.3 节 中 描述 。 

e 报头 校 验 和 一 一 这 个 字段 的 计算 方法 是 : 首先 ， 计 算 在 这 个 报头 中 所 有 
16 位 字 的 1 的 补 码 和 ; 然后 ， 把 这 个 和 的 1 的 补 码 存放 到 最 初 的 校 验 和 字 
段 中 ， 这 个 校 验 和 字段 最 初 设置 为 全 零 。1 的 补 码 和 是 两 个 字 相 加 后 再 把 
进位 位 (第 17 位 ) 加 到 这 个 和 的 最 低位 得 到 的 结果 ( 详 见 2.4.2 节 )。 例 如 ， 
11110011 + 10011010 = 110001101 = 10001110 就 是 1 的 补 码 算术 。 这 意味 
着 ， 如 果 我 们 有 一 个 如 右边 所 示 的 IP 数据 报 形式 ， 则 每 一 个 w, 都 是 IP 数 
据 报 中 的 一 个 16 位 字 。 完 整 的 校 验 和 将 一 次 计算 两 个 16 位 字 。zwi +w, = 
Si ，Si +W3=5,; Se 二 TWOk2 = Sio ( 译 者 注 : 原文 误 为 8 +zt-a =Stio) 

e 源 和 目标 地 址 识别 数据 报 要 到 哪里 去 。 在 12. 5.2 节 中 会 详细 介绍 源 和 目标 地 址 。 

e IP 选项 一 一 提供 诊断 信息 和 路 由 控制 它 是 可 选 的 。 





12. 5.2 1IPv4 的 麻烦 


IP 报头 中 给 每 个 字段 分 配 的 字 节 数 反映 了 IP 设计 的 技术 背景 。 在 ARPA 网 年 代 ， 没 有 人 
能 够 想象 网 络 将 会 如 何 成 长 ， 更 不 可 能 想到 网 络 会 用 于 民用 。 

今天 最 慢 的 网 络 也 比 20 世纪 60 年 代 最 快 的 网 络 要 快 ，IP 的 报 文 长 度 限制 在 65 536 字 节 已 
经 成 为 一 个 问题 。 对 于 某 些 网 络 设备 来 说 ， 报 文 的 移动 非常 快 ， 以 确保 报 文 在 中 间 节 点 间 没 有 
被 损坏 。( 在 千 兆 速度 下 ， 一 个 65 535 字 节 的 卫 数据 报 通过 一 个 节点 的 时 间 不 到 lms。) 

到 目前 为 止 ， 最 严重 的 问题 是 IPv4 报头 的 寻 址 问题 。 每 个 主机 和 路 由 器 在 整个 因特网 中 
都 必须 有 一 个 唯一 的 地 址 。 为 了 保证 因特网 节点 间 的 地 址 不 会 重复 ， 主 机 的 外 由 一 个 名 为 因 





特 网 名 称 与 数字 地 址 分 配 机 构 (ICANN) 的 中 心机 构 管 理 。ICANN 跟踪 随后 由 区 域 机 构 分 配 的 
IP 地 址 组 。(1ICANN 还 协调 在 协议 中 使 用 的 参数 值 的 分 配 ， 这 样 每 个 人 都 知道 哪些 值 可 以 在 因 
特 网 上 引发 哪些 行为 。) 

从 补充 材料 中 显示 的 下 报头 可 以 看 到 ， 有 2 个 或 大 约 43 亿 个 主机 ID。 因此 认为 有 大 量 
的 可 用 地 址 的 想法 是 合理 的 ,但 事实 并 非 如 此 。 问 题 在 于 ,这些 地 址 并 不 像 序列 号 那样 按照 顺 
序 分 配给 下 一 个 请 求 的 人 。 地 址 的 分 配方 法 比 序列 号 的 分 配 要 复杂 得 多 。 

IP 允许 有 3 种 类 型 的 网 络 ， 它 们 称 为 A 类 、B 类 和 C 类 。 每 一 类 可 以 直接 支持 的 节点 数 
〈《 称 为 主机 ) 不 同 ， 据 此 可 以 区 分 不 同 的 类 型 。A 类 网 络 能 够 支持 的 主机 数量 最 多 ,，C 类 最 少 。 

IP 地 址 的 前 三 位 表示 网 络 类 型 。A 类 网 络 的 地 址 总 是 以 0 开始 的 ，B 类 网 络 以 10 开始 ，C 
类 网 络 以 110 开始 。 地 址 中 的 剩余 位 用 于 网 络 编号 和 网 络 编号 中 的 主机 人 D， 如 图 12-6 所 示 。 


网 络 (7 位 ) 主机 (24 位 ) 





(27 位 ) E 类 网 络 ( 备用 ) 


图 12-6 IP 地 址 类 


IP 地 址 是 个 32 位 数 ， 它 以 点 分 十 进 制 计数 法 表示 ， 例 如 ，18.7.21.69 或 146. 186. 157. 6。 
这 些 十 进 制 数 字 中 的 每 一 位 都 表示 8 位 二 进 制 信息 ， 因 此 其 值 在 0 ~ 255 之 间 。 注 意 ， 
127. x. x. x 是 一 个 为 环 路 测试 保留 的 A 类 网 络 ， 它 检查 运行 在 主机 上 的 TCP/IP 进程 。 在 环 路 测 
试 期 间 ， 没 有 数据 报 进入 到 网 络 中 。0. 0. 0 网 络 通常 作为 网 络 中 的 默认 路 由 被 保留 。 

由 于 保留 了 网 络 0 和 127， 所 以 使 用 7 位 网 络 字段 能 够 定义 的 A 类 网 络 只 有 126 个 。A 类 
网 络 是 所 有 网 络 中 最 大 的 网 络 ， 每 个 网 络 能 够 支持 大 约 1670 万 个 节点 。 虽 然 A 类 网 络 不 太 可 
能 需要 1600 万 种 可 能 的 地 址 ， 但 是 从 1. 0. 0. 0 到 126. 255. 255. 255 的 A 类 地 址 ， 早 就 分 配给 了 
早期 的 因特网 使 用 者 ， 比 如 麻 省 理工 学 院 和 施乐 公司 。 此 外 ， 所 有 16 382 个 B 类 网 络 四 (从 
128. 0. 0. 0 到 191. 255. 255. 255 ) 也 已 经 分 配 完毕 了 。 每 个 B 类 网 络 可 以 包含 65 534 个 唯一 的 节 
点 地 址 。 因 为 很 少 有 组 织 需要 用 到 100 000 多 个 地 址 ， 所 以 他 们 的 下 一 个 选择 是 把 自己 认定 为 
C 类 网 络 ， 从 192. 0. 0. 0 到 233. 255. 255. 255 的 C 类 网 络 空间 只 有 256 个 地 址 。 这 个 地 址 数量 
远 远 不 能 满足 一 个 中 等 规模 公司 或 机 构 的 需要 。 因 此 ， 许 多 网 络 无 法 获得 连续 的 卫 地 址 以 使 
这 个 网 络 中 的 每 个 节点 都 能 够 在 因特网 上 有 自己 的 地 址 。 已 经 想 出 了 一 些 处 理 这 个 问题 的 聪明 
的 解决 方法 ， 但 是 最 终 的 解决 办 法 是 改造 整个 卫 地 址 结构 。 确 实 存在 D 类 和 下 类 网 络 ,但 是 
它们 根本 不 是 网 络 。 相 反 ， 它 们 是 保留 的 地 址 组 。D 类 地 址 从 224 ~ 240， 它 们 由 共享 相同 特性 
的 主机 组 用 于 多 播 。E 类 地 址 从 241 ~ 248 ， 被 保留 以 备 将 来 使 用 。 
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除了 地 址 空间 最 终 会 耗 尽 之 外 ，IPv4 还 有 其 他 问题 。 最 初 的 设计 者 没有 预料 到 因特网 的 增 
长 和 由 地 址 分 类 方案 导致 的 路 由 问题 。 在 因特网 骨干 路 由 器 的 路 由 表 中 通常 有 70 000 多 条 路 
由 。 目 前 的 IPv4 路 由 基础 设施 需要 进行 修改 ， 以 减少 路 由 器 存储 的 路 由 数量 。 与 缓存 存储 器 
一 样 ， 较 大 的 路 由 器 内 存 会 导致 较 慢 的 路 由 信息 检索 。 在 下 级 别 也 有 明确 的 安全 需求 。 目 前 
为 下 级 别 定义 了 一 个 名 为 IPSec ( 网 际 协议 安全 ) 的 协议 。 但 是 ， 它 是 可 选 的 ， 目 前 没有 标准 
化 或 普遍 采用 。 


TCP 报 文 段 格式 























TCP 报 文 段 格式 如 上 所 示 。 图 顶部 的 数字 是 每 个 字段 所 跨越 位 的 位 置 。 水 平行 代表 32 位 
字 。 字 段 的 定义 的 如 下 所 示 : 


源 和 目的 端口 一 一 对 运行 在 TCP 之 上 的 应 用 程序 指定 接口 。TCP 通过 端口 号 获知 这 些 
应 用 程序 。 

顺序 号 一 一 指示 在 有 效 载荷 中 数据 的 第 一 个 字 节 的 顺序 号 。TCP 给 每 个 发 送 字 节 分 配 
一 个 顺序 号 。 如 果 发 送 100 个 数据 字 节 ， 每 次 发 送 10 字 节 ， 则 第 一 个 报 文 段 的 顺序 号 
可 能 是 0， 第 二 个 报 文 段 的 顺序 号 可 能 是 10， 第 三 个 报 文 段 的 顺序 号 可 能 是 20， 等 等 
起 始 顺序 号 不 一 定 是 0， 只 要 发 送 者 和 接收 者 之 间 的 数字 是 唯一 的 。 

确认 序号 一 一 包含 接收 者 正在 等 待 的 下 一 个 数据 的 顺序 号 。TCP 使 用 这 个 值 确定 是 否 
有 数据 报 在 传输 过 程 中 丢失 了 。 

数据 偏 移 一 一 在 报头 中 包含 32 位 字 的 数量 ， 等 价 于 数据 在 这 个 报 文 段 中 开始 的 相对 位 
置 。 它 也 称 为 报头 长 度 。 

保留 一 一 这 6 位 必须 是 零 ， 直 到 有 人 对 它们 有 很 好 的 用 途 。 

标志 一 一 包含 6 位， 主要 用 于 协议 管理 。 当 它们 的 值 非 零 时 ， 设置 为 “ 真 "*。TCP 标志 
和 它们 的 含义 是 : 

URG: 指示 此 段 中 存在 紧急 数据 。 紧 急 指针 字段 ( 见 下 文 ) 指 向 紧急 信息 的 第 一 个 字 节 
位 置 。 

ACK: 指示 确认 序号 字段 ( 见 下 文 ) 是 否 包 含有 意义 的 








um 


信息 。 
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PSH: 告诉 连接 中 涉及 的 所 有 TCP 进程 以 清空 它们 的 缓冲 区 ， 也 就 是 说 ， 把 数据 “ 推 
送 ” 给 接收 者 。 当 在 有 效 负 载 中 存在 紧急 数据 时 ， 可 设置 此 标志 。 

RST: 重 置 连接 。 通 常 ， 它 对 接收 到 的 所 有 报 文 进 行 强制 验证 ， 并 将 接收 者 退回 到 
监听 更 多 数据 ”的 状态 。 

SYN: 指示 这 个 报 文 段 的 目的 是 同步 顺序 号 。 如 果 发 送 者 发 送 [SYN，SEQ# =x] ， 那 么 
随后 它 应 该 从 接收 者 那里 收 到 [ ACK，SEQ# =x+1]。 在 两 个 节点 建立 连接 时 ， 它 们 应 
交换 各 自 的 初始 序列 号 。 

FIN: 这 是 “完成 ”标志 。 它 让 接收 者 知道 发 送 者 已 完成 传输 ， 实际 上 已 经 开始 关闭 
连接 程序 。 

。 窗口 一 一 通过 说 明 在 任何 一 个 报 文 段 中 各 自 希望 接受 的 字 节 数 ， 允 许 节 点 定义 各 自 数 
据 窗口 的 大 小 。 例 如 ， 如 果 发 送 者 传送 的 字 节 编号 为 0 ~ 1023 ， 接 收 者 在 ACK# 字 上 段 用 
1024 确认 并 且 窗口 值 为 512， 那 么 发 送 者 将 发 送 字 节 编号 为 1024 ~ 1535 的 数据 作为 回 
复 。( 当 接收 者 的 缓冲 区 开始 填 满 时 ， 可 能 会 这 种 情况 发 生 ， 因 此 它 请 求 发 送 者 慢 下 
来 ， 直 到 接收 者 赶 上 。) 请 注意 ， 如 果 接 收 者 的 应 用 程序 运行 非常 缓慢 ， 比 如 说 它 每 次 
从 缓冲 区 中 只 取 1 或 2 字 节 ， 那 么 运行 在 接收 者 的 TCP 进程 应 该 等 待 ， 直 到 应 用 程序 
缓冲 区 空 到 足以 容纳 另 一 个 报 文 段 为 止 。 如 果 接 收 者 发 送 的 窗口 大 小 为 0， 效 果 是 确 
认 所 有 字 节 直到 确认 编号 ， 然 后 停止 进一步 的 数据 传送 ， 直 到 再 次 发 送 相同 的 确认 纺 
号 和 非 零 窗口 。 

。 校 验 和 一 一 这 个 字段 包含 TCP 报 文中 各 个 字段 的 校 验 和 (除了 数据 填充 和 校 验 和 本 
身 )， 以 及 一 个 外 伪 报 头 ,， IP 伪 报 头 如 下 : 





就 像 前 面 解释 的 IP 校 验 和 ，TCP 校 验 和 是 对 这 个 报头 和 TCP 报 文 段 的 文本 中 的 所 有 16 位 
字 求 1 的 补 码 和 。 

日 紧急 指针 一 一 指向 紧急 数据 的 第 一 个 字 节 。 这 个 字段 仅 在 URG 标志 置 位 时 才 有 意义 。 
: 的 协商 以 及 是 否 可 以 使 用 选择 确认 (SACK)。 如 
果 一 个 报 文 段 从 中 间 某 个 地 方 丢 了 ， 则 SACK 允许 重 发 一 个 窗口 内 的 特定 报 文 段 ， 而 
不 是 要 求 重 发 整个 窗口 。 在 讨论 TCP 流 控制 之 后 ， 这 个 概念 将 更 加 清晰 。 








12. 5. 3 ”传输 控制 协议 


IP 的 唯一 目的 是 给 数据 报 确定 在 网 络 中 的 正确 路 径 。 你 可 以 认为 卫 是 一 个 快递 员 ， 他 们 
不 关心 包 右 的 内 容 或 交付 的 先后 顺序 。 传 输 控制 协议 (TCP) 是 IP 服务 的 使 用 者 ， 它 关心 包 庄 
的 内 容 和 交付 的 先后 顺序 以 及 许多 其 他 事情 。 

两 个 TCP 进程 之 间 的 协议 连接 比 IP 层 上 的 协议 复杂 得 多 。IP 仅 基 于 报头 信息 就 会 简单 地 
接受 或 拒绝 数据 报 ，TCP 与 运行 在 远程 系统 上 的 一 个 TCP 进程 打开 一 个 名 为 连接 的 会 话 。TCP 
连接 类 似 于 电话 交谈 ，, 它 有 自己 的 协议 “礼节 ”。 作 为 启动 会 话 的 一 部 分 ，TCP 还 将 在 运行 在 
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它 上 面 的 应 用 程序 中 打开 一 个 服务 访问 点 (SAP)。 在 TCP 中 ,这 个 SAP 是 一 个 数值 ， 称 其 为 一 
个 端口 。 端 口号 、 主 机 ID 和 协议 名 称 的 组 合成 为 一 个 套 接 字 ， 其 逻辑 相当 于 运行 在 TCP 之 上 
的 应 用 程序 的 文件 名 或 句柄 。 使 用 TCP 的 应 用 程序 通过 套 接 字 读 取 数据 ， 而 不 是 使 用 磁盘 文件 
名 访问 数据 。 端 口号 0 ~ 1023 是 “公认 ”的 端口 号 ， 因 为 它们 保留 用 于 特定 的 TCP 应 用 程序 。 
例如 ，TCP/IP 文件 传输 协议 (FTP) 应 用 程序 使 用 端口 20 和 端口 21。Telnet 终端 协议 使 用 端口 
23。 端 口号 1024 ~ 65 535 可 以 用 于 自 定 义 的 实现 。 

TCP 可 确保 它 提供 给 应 用 程序 的 数据 流 是 完整 的 ， 顺 序 是 正确 的 ， 并 且 没 有 重复 数据 。 
TCP 确保 它 的 报 文 段 ( 带 报头 的 数据 包 ) 不 要 发 送 得 太 快 ， 以 至 于 中 间 节 点 或 接收 方 无 法 跟 上 报 
文 的 发 送 速 度 ， 从 而 补偿 底层 网 络 的 不 平衡 。 一 个 TCP 报 文 段 的 报头 至 少 需要 20 字 节 。 数 据 
的 有 效 载荷 是 可 选 的 。 一 个 报 文 段 最 多 可 以 有 65 515 字 节 ， 加 上 报头 整个 报 文 段 与 一 个 王 有 
效 载荷 刚好 相等 。 如 果 需 要 ，IP 可 以 把 一 个 TCP 报 文 段 分 段 发 送 ， 如 果 一 个 中 间 节 点 请 求 这 
样 做 的 话 。 

TCP 提供 了 一 种 可 靠 的 、 面 向 连接 的 服务 。 面 向 连接 意味 着 在 主机 交换 任何 信息 之 前 必须 
建立 连接 (就 像 电话 呼叫 ) 。 分 配给 每 个 报 文 段 的 顺序 号 提供 了 这 种 可 靠 性 。 已 接 到 报 文 段 由 
确认 信息 来 验证 ， 而 且 确认 信息 必须 在 特定 的 时 间 段 内 发 送 和 接收 。 如 果 没 有 收 到 确认 信息 ， 
那么 数据 会 重新 传送 。 在 下 一 节 中 将 简要 介绍 该 协议 的 工作 原理 。 


12. 5.4 TCP 的 工作 过 程 


为 了 在 两 个 (或 多 个 ) 运 行 于 各 自 系统 的 TCP 进程 间 建 立 一 个 可 靠 、 有 序 、 无 错误 的 连接 ， 
所 有 这 些 应 如 何 组 合 在 一 起 ?成 功 的 通信 需要 三 个 阶段 : 一 是 启动 连接 ， 二 是 交换 数据 ， 三 是 
关闭 连接 。 首 先 ， 发 起 者 A 给 运行 在 远程 系统 B 上 的 TCP 进程 传输 一 个 “开放 ”的 原 语 。 假 
设 B 正 在 侦 听 “打开 ”请 求 。 这 个 “开放 ” 原 语 的 形式 如 下 : 








A 和 B 现在 已 经 相互 确认 并 且 同 步 了 开始 的 顺序 号 。A 的 下 一 顺序 编号 将 是 :+2，B 的 将 
是 j+2。 像 这 样 的 协议 交换 过 程 通常 称 为 三 次 握手 。 大 多 数 网 络 文献 用 示意 图 的 方式 展示 这 些 
交换 过 程 ， 如 图 12-7 所 示 。 





时 间 





图 12-7 TCP 的 三 次 握手 


在 A 和 B 之 间 建 立 连接 之 后 ， 它 们 可 以 进行 窗口 大 小 的 协商 ， 并 为 其 连接 设置 其 他 选项 。 
窗口 告诉 发 送 者 在 两 次 确认 之 间 应 该 发 送 多 少数 据 。 例 如 ,假设 A 和 B 协商 的 窗口 大 小 是 500 
字 节 ， 数 据 的 有 效 载荷 是 100 字 节 ， 两 者 都 同意 不 使 用 选择 性 确认 (随后 讨论 )。TCP 在 两 个 主 
机 之 间 管理 的 数据 流 过 程 如 图 12-8 所 示 。 注 意 ， 当 一 个 报 文 段 丢失 时 发 生 了 什么 : 整个 窗口 
被 重新 发 送 ， 尽 管 随后 的 各 报 文 段 传递 无 误 。 


A 从 字 节 0 开始 
发 送 100 字 节 

一 一 B 成 功 接收 字 节 0 ~99， 发 送 确 认 
窗口 滑动 : 在 缺少 确认 

的 情况 下 ，A 能 够 发 送 字 

节 100~599 

一 一 数据 报 损 坏 或 误 传 


A 看 到 字 节 100 ~ 199 
没有 传送 成 功 


窗口 滑动 : 在 缺少 确 
认 的 情况 下 ，A 能 够 发 
送 字 节 300 ~599 





图 12-8 有 报 文 段 丢失 时 的 TCP 数据 传送 


但 是 ， 如 果 一 个 确认 丢失 了 ， 那 么 随后 的 确认 能 够 防止 丢失 了 确认 的 数据 重新 传送 ， 如 
图 12-9 所 示 。 当 然 ， 确认 必须 及 时 发 送 ， 以 防止 由 于 “超时 ”引起 重 传 。 

使 用 确认 编号 ， 接 收 者 也 能 要 求 发 送 者 减 慢 或 暂停 传送 。 当 接收 者 的 缓冲 区 太 满 时 ， 有 必 
要 这 样 做 。 图 12-10a 说 明了 操作 过 程 。 图 12-10b 说 明 当 B 不 能 接收 任何 数据 时 是 如 何 保持 连 
接 的 。 

完成 数据 交换 后 ，TCP 进程 中 的 一 个 或 两 个 都 可 以 终止 连接 。 连 接 的 一 侧 ( 比如 A) ， 通 过 
发 送 带 有 FIN 标志 为 真 的 报 文 段 告诉 另 一 端 B 完成 了 终止 连接 。 这 实际 上 是 关闭 了 从 A 到 B 
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的 连接 。 然 而 ，B 可 以 继续 它 的 会 话 ， 直 到 它 不 再 发 送 数据 为 止 。 一旦 B 完成 ， 它 也 传送 给 一 
个 带 有 FIN 标志 为 真 的 报 文 段 。 如 果 A 确认 了 B 的 FIN， 则 这 个 连接 会 从 两 端 终 止 。 如 果 B 在 
超时 时 间 段 内 没有 收 到 确认 ， 则 它 会 自动 终止 这 个 连接 。 


A B 
A 从 字 节 0 开始 
发 送 100 字 节 
| 一 一 也 成 功 接收 字 节 0~99， 发 送 确认 
一 一 但 是 确认 信息 ，ACK#= 100， 
它 损坏 或 误 传 
尽管 确认 信息 丢失 ， 


但 是 传输 继续 进行 。 窗 一 一 一 
口 滑动 到 字 节 200 ~ 699 





图 12-9 丢失 一 个 确认 的 情况 


A 
|, 





A 从 字 节 1000 开 始 


S, 
发 送 100 字 节 EQ#= 1000 


一 一 B 告 诉 A 下 一 次 仅 发 送 50 字 节 





一 一 B 告 诉 A 暂时 不 要 发 送 任何 字 节 
a ) B 告 诉 A 放 慢 速 度 
A B 
如 果 在 2min 内 ，A 没 有 

从 了 B 处 听 到 任何 消息 ， 由 一 
它 将 会 发 送 1 字 节 

一 一 B 必 须 向 A 发 送 确 认 。 

否则 ，A 将 终止 连接 





b ) B 保 持 连接 却 不 能 接收 任何 数据 
图 12-10 ”TCP 流 控制 


与 硬性 规定 相反 ，TCP 允许 发 送 者 和 接收 者 协商 超时 时 间 。 如 果 连 接 速 度 慢 于 它 比 较 快 的 
时 候 ， 则 超时 时 间 应 该 设置 为 更 大 的 值 。 发 送 者 和 接收 者 也 可 以 使 用 选择 确认 。 当 使 能 选择 确 
认 (SACK) 时 ， 接 收 者 必须 确认 每 个 数据 报 。 换 名 话说， 这 时 不 使 用 滑动 窗口 。 当 一 个 错误 发 





生 时 SACK 能 够 节省 一 些 带宽 ， 因 为 仅 这 个 没有 确认 的 报 文 段 ( 不 是 整个 窗口 ) 会 重 传 。 但 是 ， 
如 果 交 换 没有 错误 发 生 ， 那 么 发 送 确认 报 文 段 就 会 浪费 了 带宽 。 因 此 ， 只 有 在 接收 者 上 有 少量 
TCP 缓存 时 才 会 选择 SACK。 接 收 者 的 缓存 越 大 ， 接 收 失 序 报 文 段 的 “余地 ”就 越 大 。TCP 尽 
其 所 能 地 为 运行 在 它 上 层 的 应 用 程序 提供 一 个 无 差错 、 有 序 的 数据 流 。 


12. 5..5 IPv6 


到 了 1994 年 ， 由 IP 的 B 类 地 址 问题 形成 的 危机 出 现 了 , 它 有 可 能 使 因特网 的 爆炸 性 增长 
突然 停止 。 在 这 种 逼近 灾难 的 感觉 的 推动 下 ，IETF 开始 了 IPv4 接替 者 的 研究 工作 ， 现 在 称 为 
IPv6。IETF 的 参与 者 发 布 了 一 系列 的 实验 协议 ， 这 些 实验 协议 后 来 称 为 I Pv5。 这 些 协议 的 修正 
和 增强 版 本 称 为 IPv6。( 译 者 注 : IPv6 并 不 是 从 IPv5 演化 来 的 ， 因 为 在 发 布 IPv6 时 ，IPv5 已 经 
被 实验 性 的 因特网 流 控制 协议 占用 了 。) 专 家 预测 ， 在 21 世纪 第 一 个 十 年 的 后 期 之 前 ，IPv6 将 
不 会 广泛 实施 。( 每 天 都 有 更 多 的 因特网 应 用 程序 正在 进行 修改 以 便 与 IPv6 协同 工作 。) 事 实 上 ， 
一 些 反 对 者 认为 ，IPv6 将 “永远 不 会 ”完全 部 署 ， 因 为 如 此 多 昂贵 的 硬件 需要 更 换 ， 并 且 已 经 找 
到 了 解决 IPv4 中 最 环 手 问题 的 方法 。 但 是 ， 与 批评 者 所 认为 的 相反 ，IPv6 不 仅 是 一 个 B 类 地 址 短 
缺 问题 的 补丁 程序 。 它 修复 了 大 多 数 人 没有 意识 到 的 许多 问题 ， 随 后 将 对 此 加 以 解释 。 

IETF 的 最 初 动机 是 设计 一 个 IPv4 的 接 蔡 者 ， 当 然 ， 应 把 源 主 机 和 目标 主机 的 人 地 址 空间 
都 从 当前 的 32 位 扩展 到 128 位 。 这 是 一 个 巨大 的 地 址 空间 ， 它 给 出 了 2 ”个 可 能 的 主机 地 址 。 
具体 而 言 ， 如 果 每 个 地 址 分 配给 一 个 质量 为 28g(1loz) 的 网 卡 ，2 ”个 网 卡 的 质量 是 整个 地 球 质 
量 的 1.61 千 万 倍 ! 所 以 IPv6 地 址 的 供应 是 无 穷 无 尽 的 。 

拥有 如 此 大 地 址 空间 的 缺点 是 地 址 管理 变 得 至 关 重 要 。 如 果 地 址 被 无 组 织 地 随意 分 配 ， 那 
么 就 不 可 能 得 到 有 效 的 数据 包 路 由 。 因 特 网 上 的 每 一 个 路 由 器 最 终 都 需要 超级 计算 机 的 存储 量 
和 速度 来 处 理 随 之 而 来 的 路 由 表 爆 炸 。 为 了 阻止 这 一 问题 ，IETF 提出 了 层次 化 的 地 址 结构 ， 
它 叫 作 可 聚集 全 球 单 播 地 址 格式 ， 如 图 12-11a 所 示 。IPv6 地 址 的 前 三 位 组 成 了 一 个 标志 ， 它 
指示 这 个 地 址 是 一 个 全 球 单 播 地 址 。 接 下 来 的 13 位 形成 了 顶层 聚集 标识 (TLA ID) ， 后 面 是 8 
个 保留 位 ， 如 果 需 要 ， 那 么 它 允 许 对 TLA ID 或 者 24 位 次 级 聚集 标识 ( NLA ID ) 进行 扩展 。 一 
个 TLA 实体 可 以 是 一 个 国家 也 可 以 是 一 个 主要 的 全 球 电信 运营 商 。 一 个 NLA 实体 可 以 是 一 个 
大 公司 、 一 个 政府 部 门 、 一 个 学 术 机 构 、 一 个 ISP 也 可 以 是 一 个 小 的 电信 运营 商 。 跟 在 NLA ID 
后 面 的 16 位 是 站 点 级 聚集 标识 (SLA ID) 。NLA 实体 能 够 使 用 这 个 字段 创建 自己 的 层次 结构 ， 
允许 每 个 NLA 实体 有 65 536 个 子 网 络 ， 每 个 子 网 络 可 以 有 2” 台 主 机 。 这 个 层次 结构 如 
图 12-11b 所 示 。 

乍 看 起 来 ， 在 每 个 子 网 上 人 允许 2” 台 主 机 的 想法 似乎 与 IPv4 网 络 分 类 系统 一 样 浪费 地 址 空 
间 。 然 而 ， 为 了 支持 无 状态 地 址 自动 配置 这 样 一 个 大 的 字段 是 必要 的 ， 这 是 IPv6 中 的 一 个 新 
特性 。 在 无 状态 地 址 自动 配置 中 ， 一 个 主机 使 用 48 位 地 址 指示 它 的 网 络 接口 卡 ( 它 的 MAC 地 
址 ， 在 12. 6. 2 节 中 将 会 解释 )， 连 同 从 附近 路 由 器 检索 到 的 网 络 地 址 信息 ， 形 成 了 整个 全 地 
址 。 在 这 个 过 程 中 ， 如 果 没 有 出 现 问 题 ， 那 么 不 需要 网 络 管理 员 的 干预 ， 网 络 中 的 每 个 主机 自 
己 配置 地 址 信息 。 如 果 一 个 实体 改变 了 它 的 ISP 或 电信 运营 商 ， 那 么 这 项 功能 能 够 简化 网 络 管 
理 员 的 工作 ， 网 络 管理 员 只 需要 更 改 路 由 器 的 IP 地 址 。 无 状态 地 址 自动 配置 将 自动 更 新 网 络 
中 每 个 节点 的 TLA 或 SLA 字段。 

编写 IPv6 地 址 的 语法 也 与 IPv4 地 址 的 不 同 。IPv4 地 址 用 点 分 十 进 制 表示 ， 例 如 : 
146. 186. 157. 6。IPv6 的 地 址 使 用 十 六 进 制 表示 ， 用 冒号 分 隔 ， 地 址 形式 如 下 : 


30FA:505A:B210:224C:1114:0327:0904:0225 


这 使 得 卫 地 址 的 等 效 二 进 制 数 更 容易 识别 。 
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b ) 可 聚集 全 球 单 播 层次 结构 
图 12-11 


IPv6 地 址 可 以 缩写 ， 在 可 能 的 情况 下 零 可 以 省 略 。 如 果 一 个 16 位 组 是 0000， 那么 就 可 以 
写 为 0, 或 者 完全 省 略 。 如 果 这 种 省 略 导致 超过 了 两 个 冒号 ,那么 可 以 把 冒号 减少 到 两 个 (只 
有 一 组 连续 超过 两 个 冒号 的 条 件 下 )。 例 如 ，IPv6 地 址 : 

30FA:0000:0000:0000:0010:0002:0300 
可 以 写 为 

ORA:O0 0D:2300 
甚至 可 以 写 为 

30FA::10:2:300 


然而 ， 像 30FA:: 24D6:: 12CB 这 样 的 地 址 是 无 效 地 址 。 

IETF 也 提出 了 另外 两 种 路 由 改进 方法 : 实现 多 播 (一 个 消息 放 到 网 络 上 ， 由 多 个 节点 读 
取 ) 以 及 选 播 (一 个 逻辑 节点 组 的 任何 一 个 节点 都 可 以 是 一 个 消息 的 接收 者 ， 但 是 这 个 数据 包 
没有 特别 指定 接收 者 ) 。 这 一 特点 ， 除 了 无 状态 地 址 自动 配置 外 ， 也 便于 支持 移动 设备 ,移动 
设备 是 因特网 用 户 的 一 个 越 来 越 重要 的 领域 ,特别 是 一 些 大 多 数 通 信和 都 发 生 在 无 线 网 络 上 的 
国家 。 

正如 前 面 提 到 的 ， 安 全 是 另 一 个 主要 领域 ， 在 这 个 领域 中 IPv6 不 同 于 IPv4。 所 有 IPv4 的 
安全 功能 (IPSec ) 都 是 “可 选 的 ”， 这 意味 着 没有 硬性 要 求实 现任 何 类 型 的 安全 ， 而 且 大 多 数 装 
置 都 没有 选择 安全 功能 。 在 IPv6 中 ，IPSec 是 强制 性 的 。 在 IPv6 的 安全 改进 中 ， 有 一 种 机 制 可 
以 防止 地 址 欺骗 。 在 发 生地 址 欺骗 时 ， 一 个 主机 可 能 会 与 另外 一 个 使 用 伪造 卫 地 址 的 主机 通 
信 。( 卫 欺骗 经 常用 于 破坏 过 滤 路 由 器 和 防火 墙 ， 过 滤 路 由 器 和 防火 墙 除了 其 他 功能 之 外 ,， 主 
要 是 不 让 外 人 访问 保密 的 企业 内 部 网 络 。) IPSec 还 支持 加 密 等 措施 ， 使 歹徒 发 现 获取 未 经 授权 
的 信息 更 难 。 

IPv6 的 最 大 特点 也 许 是 它 提供 了 一 个 过 渡 方 案 ， 这 个 方案 允许 网 络 逐 步 迁 移 到 新 的 格式 。 
在 IPv6 中 建立 了 对 IPv4 的 支持 。 使 用 两 种 协议 的 设备 称 为 双 栈 设备 ， 因 为 它们 支持 IPv4 和 
IPv6 两 种 协议 栈 。 当 今 市 场 上 的 大 多 数 路 由 器 都 是 双 栈 设备 ， 期 待 IPv6 在 不 久 的 将 来 成 为 





现实 。 

IPv6 优 于 IPv4 的 地 方 显而易见 : 更 大 的 地 址 空间 、 更 好 的 内 置 服务 质量 和 更 好 、 更 高 效 
的 路 由 。 问 题 是 我 们 何 时 会 迁移 到 IPv6。 对 IPv6 的 需求 和 必要 的 应 用 程序 开发 将 会 驱动 这 个 
过 渡 。 虽 然 硬 件 更 换 成 本 是 一 个 重要 的 障碍 ， 但 是 技术 人 员 培 训 和 更 换 小 型 的 卫 设 备 ( 比 如 网 
络 传真 机 和 打印 机 ) 也 将 增加 过 渡 的 总 成 本 。 随 着 带 有 IP 的 汽车 (IP-ready automobiles ) 的 出 现 ， 
以 及 许多 其 他 因特网 设备 的 出 现 ，IPv4 已 经 满足 不 了 许多 当前 应 用 的 需求 了 。 





IPv6 报头 


当然 ，IPv4 的 明显 问题 是 它 的 32 位 地 址 字段 。IPv6 把 地 址 字段 扩展 到 128 位 从 而 避免 了 
这 个 问题 。 为 了 使 IPv6 报头 尽 可 能 小 (这 可 加 快 路 由 ) ， 在 IPv6 主 报头 中 没有 包含 在 IPv4 报头 
中 很 少 使 用 的 字段 。 如 果 需 要 这 些 字 段 ， 那 么 可 以 指向 下 一 报头 (Next Header) 指针。 使 用 下 一 
报头 字段 ，IPv6 可 以 支持 大 量 的 报头 字段 。 因 此 ， 未 来 若 要 再 增强 下， 则 它 将 会 比 从 IPv4 切 
换 到 IPv6 的 破坏 性 要 小 得 多 。 下 面 将 解释 IPv6 的 报头 字段 。 


WA 
流量 


类 别 















1 
和 








流标 签 





| 下 一 报头 | 跳 数 限 制 





源 IP 地 址 


| 





目的 IP 地 址 





。 版 本 : 总 是 0110。 

。 流量 类 别 : IPv6 最 终 能 够 分 辨 出 实时 传输 (如 语音 和 视频 ) 和 较 少 时 间 敏 感性 的 数据 传 
输 之 间 的 差别 。 这 个 字段 将 用 来 区 分 这 两 种 业务 类 型 。 

。 流标 签 : 这 个 字段 的 规范 仍 在 制定 中 。 一 个 “ 流 ” 是 一 种 会 话 ， 要 么 广播 到 所 有 节点 ， 
要 么 在 两 个 特定 节点 之 间 进 行 传输 。 流 标签 字段 识别 一 个 特定 的 流 ， 并 且 中 间 路 由 器 
将 以 与 流 字 段 中 代码 一 致 的 方式 来 路 由 这 个 数据 包 。 

。 数据 长 度 : 标示 数据 的 字 节 长 度 ， 包括 附加 报头 的 大 小 。 

e 下 一 报头 : 表示 主 报 头 后 面 的 报头 类 型 (如 果 有 的 话 )。 如 果 一 个 IPv6 要 求 在 一 个 报头 
中 能 携带 更 多 的 协议 信息 ， 那 么 下 一 报头 字段 提供 了 一 个 扩展 报头 。 这 些 扩展 报头 被 
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放 在 段 的 载荷 中 。 如 果 没 有 IP 扩展 报头 ;那么 这 个 字段 将 包含 “TCP”" 值 ， 这 意味 着 在 
载荷 中 第 一 个 报头 数据 属于 TCP， 而 不 是 IP。 通 常 ， 只 有 目标 节点 会 检查 扩展 报头 中 
的 内 容 。 中 间 节 点 把 它们 当 作 普 通 的 数据 来 传递 

e 跳 数 限制 : 这 个 字段 为 16 位 ， 比 IPv4 中 要 大 得 多 ， 不许 256 填 与 在 IPv4 中 一 样 ， 
et bhi 如 果 它 变 成 0， 那 么 这 个 报 文 会 被 丢弃 并 
且 通 过 IPv6 的 一 个 ICMP 消息 来 通知 发 送 

e 源 和 目的 地 址 : 比 IPv4 的 地 址 大 得 多 ， 是 含义 相同 。 对 于 地 址 格式 的 讨论 ， 参 见 
本 书 


以 太 网 的 过 去 和 现在 


以 太 网 是 当今 局 域 网 (LANs) 的 主流 结构 。 以 太 网 设备 可 以 在 桌面 上 、 在 数据 中 心里 以 及 
在 客厅 里 找到 。 在 20 世纪 70 年 代 初 ， 施 乐 公司 的 罗伯特 ， 梅 特 卡 夫 和 戴 维 . 博 格 斯 开发 了 以 
太 网 ， 当 时 他 们 绝对 没有 想到 以 太 网 的 使 用 会 如 此 普及 。 在 20 世纪 80 年 代 初 ，DEC 公司 和 
Intel 公司 帮助 改进 了 以 太 网 ， 并 且 为 市 场 带 来 了 许多 创新 产品 。 等 到 IEEE 开始 802 项 目 时 ， 
以 太 网 已 是 一 个 为 大 家 接受 的 网 络 架 构 。 因 此 ， 它 的 操作 理论 成 为 IEEE 802.3 标准 中 的 一 部 
分 ， 但 是 以 太 网 与 这 个 标准 并 不 完全 一 致 ， 因 为 以 太 网 定义 了 在 IEEE 802.3 中 没有 的 座 辑 链 
路 功能 。(IEEE 802. 2 是 数据 链 路 规范 。) 在 以 太 网 PDU 和 IEEE 802.3 PDU 之 间 也 有 一 些 细微 
的 不 同 。 由 于 它 部 署 广泛 ， 所 以 我 们 的 讨论 将 集中 在 以 太 网 上 。 

以 太 网 使 用 载波 侦 听 多 路 访问 /碰撞 检测 ( CSMA/LCD ) 介质 访问 控制 。 在 将 数据 放 到 网 络 
之 前 ， a 
如 果 线 路 是 安静 的 (静默 )， 那么 接口 把 传输 帧 放 到 线路 上 。 如 果 另 一 个 工作 站 恰好 在 同一 时 
刻 也 执行 同样 操作 ， 那 么 at 两 个 工作 站 都 应 该 会 检测 到 这 个 碰撞 。 

传统 的 以 太 网 运行 速率 为 10Mbit/s， 它 们 使 用 总 线 拓扑 ， Wt 
接 到 总 线 上 (多 路 访问 ) ， 因 此 所 有 节点 都 可 以 接收 每 个 帧 。 当 每 个 LAN 工作 站 接收 到 一 个 帧 
时 ， 它 检查 帧 报头 中 的 (MAC) 地 址 信息 。 如 果 一 个 工作 站 看 到 了 自己 的 地 址 ， 那 么 就 剥 去 帧 
同步 位 ， 然 后 把 PDU 送 到 它 的 逻辑 链 路 层 。 





一 种 传统 的 以 太 网 总 线 架 构 


为 了 检测 冲突 ， 一 个 以 太 网 接口 卡 在 传输 消息 时 必须 侦 听 这 个 线路 。 如 果 它 看 到 电压 值 高 
于 允许 值 ， 它 就 知道 了 另外 一 个 节点 几乎 在 相同 的 时 间 开 始 传送 信息 了 ， 这 些 帧 已 经 在 总 线 的 
某 个 地 方 发 生 了 冲突 。 一 旦 发 现 冲 突 ，NIC 会 广播 一 个 32 位 干扰 信号 ， 以 通知 所 有 工作 站 发 
生 了 一 次 冲突 。 这 次 冲突 涉及 的 工作 站 都 将 停止 发 送信 息 ， 并 且 要 等 待 一 个 ( 伪 ) 随 机 时 间 后 
才能 尝试 再 次 发 送信 息 。 当 PDU 的 长 度 足 够 长 时 ， 这 种 方法 的 效果 很 好 。 因 此 ， 在 传统 的 共 





享 总 线 CSMA/CD 以 太 网 系统 中 ， 最 大 速度 大 约 是 100Mbit/s。 如 果 速 度 更 快 的 话 ， 传 统 以 太 网 
的 PDU 就 太 短 了 。( 速 率 越 快 ， 每 位 的 宽度 越 窄 。) 为 了 支持 更 快 的 速度 ， 需 要 求 对 以 太 网 的 架 
构 进行 调整 。 千 兆 位 速度 要 求 将 网 络 的 拓扑 结构 从 共享 总 线 更 改 为 交换 星 形 网 络 拓扑 ， 如 下 图 
所 示 。 在 星 形 拓扑 中 ， 从 用 户 节点 到 网 络 主 干 ， 一 次 交换 一 个 信号 。 端 节点 连接 到 速度 为 
100Mbit/s 的 网 络 上 ， 上 游 交 换 机 以 1Gbit/s 或 10Gbit/s 互 连 。 介 质 访问 管理 是 在 交换 层 进 行 
的 ， 所 以 在 端 节 点 上 可 以 关闭 冲突 检测 。 交 换 机 可 以 连接 到 其 他 网 络 组 件 上 ， 如 集线器 和 进 一 
步 扩 展 网 络 的 中 继 器 ， 并 且 向 较 慢 的 网 段 提 供 向 下 兼容 性 。 千 兆 位 以 太 网 与 更 为 激进 和 晶 贵 的 
网 络 解决 方案 (如 光纤 通道 ) 直接 竞争 。 我 们 在 第 13 章 中 讨论 光纤 通道 。 


1Gbit/s 上 
DSS 
100Mbit/s 
服务 器 
0 
| E A | ; 
12.6 网 络 组 成 


计算 机 网 络 通常 是 根据 它们 服务 的 地 理 区 域 进行 分 类 。 最 小 的 网 络 是 局 域 网 (LAN) 。 虽 然 
它们 能 够 包含 几 千 个 节点 , 但 是 LAN 通常 用 于 单个 建筑 物 或 一 组 相互 靠近 的 建筑 物 。 当 一 个 
LAN 覆盖 范围 超过 一 个 建筑 物 时 ， 有 时 也 称 为 校园 网 。 通 常 ， 一 个 LAN 所 覆盖 的 区 域 (地 产 ) 
与 这 个 LAN 本 身 有 相同 的 所 有 权 ( 或 控制 权 ) 。 城 域 网 ( MAN ) 是 履 盖 一 个 城市 及 其 郊区 的 网 
络 。 城 域 网 经 常 跨越 一 些 区 域 ， 这 些 区 域 并 不 属于 网 络 的 所 有 人 。 广 域 网 ( WAN) 可 以 覆盖 多 
个 城市 或 整个 世界 。 

同时 ，LAN、MAN 和 WAN 所 采用 的 协议 相互 之 间 有 很 大 差异 。MAN 和 WAN 通常 具有 高 
速 知 吐 量 ， 因 为 它们 作为 主干 网 要 为 多 个 较 慢 的 LAN 提供 服务 ,或 者 它们 要 对 远离 终端 用 户 
的 数据 中 心中 的 大 型 主机 提供 访问 。 然 而 ， 随 着 网 络 技术 的 发 展 ， 现 在 这 些 网 络 在 速度 和 协议 
方面 没有 太 多 的 不 同 ， 除 了 所 有 权 外 。 一 个 人 的 校园 局 域 网 可 能 是 男 一 个 人 的 城 域 网。 事实 
上 ， 随 着 局 域 网 越 来 越 快 ， 它 更 容易 与 广域网 技术 进行 集成 ， 可 以 想象 城 域 网 的 概念 最 终 可 能 
会 完全 消失 。 
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本 节 讨 论 对 于 局 域 网 、 城 域 网 和 广域网 都 相同 的 物理 网 络 部 件 。 我 们 从 网 络 组 织 的 最 低层 
第 一 层 ( 物理 介质 层 ) 开 始 讨论 。 


12. 6. 1 物理 传输 介质 


几乎 任何 具有 携带 信号 能 力 的 介质 都 支持 数据 通信 。 通 信介 质 大 致 有 两 种 类 型 : 有 线 传输 
介质 和 无 线 传输 介质 。 无 线 介 质 采 用 红外 、 和 微波、 卫星 或 广播 电台 的 载波 信号 广播 数据 到 广播 
频道 。 有 线 介 质 是 诸如 铜 线 或 光缆 等 能 直接 连接 到 每 个 网 络 节点 的 物理 连接 器 。 

有 线 介质 的 物理 和 电 特 性 决定 了 它们 在 不 同 距 离 上 准确 传递 给 定 频率 信号 的 能 力 。 在 第 7 
章 中 ,我 们 提 到 信号 长 距离 传输 会 衰减 ( 变 弱 ) 。 距 离 越 长 ， 信 和 号 频率 越 高 ， 误 减 越 大 。 铜 线 
中 信和 号 的 衰减 由 多 种 电 现象 相互 作用 导致 ， 其 中 最 主要 的 是 铜 导体 的 内 部 电阻 和 当 信和 号 线 披 此 
接近 时 发 生 的 电 干 扰 ( 电 感 和 电容 ) 。 那 些 荧 光 灯 和 电机 的 周围 外 部 电场 也 能 减弱 甚至 改变 铜 
线 内 的 传输 信号 。 总 的 来 说 ， 影 响 信号 准确 传输 的 电 现象 称 为 噪声 。 信 号 和 噪声 强度 均 以 分 贝 
(dB ) 表 示 。 电 缆 在 有 噪声 的 情况 下 是 以 不 同 频率 传送 信号 的 好 坏 程度 来 评定 的 。 其 结果 是 通 
信 信 道 的 信 噪 比 ， 而 且 信 噪 比 也 是 用 分 贝 表示 的 : 

信 噪 比 (dB) = 10lg( 信 和 号/ 噪声) 
其 中 ， 信 和 号 /噪声 的 单位 为 dB。 

在 技术 上 一 种 介质 的 带宽 是 它 能 承载 信息 的 频率 范围 ， 用 赫 效 表示。 介质 的 带宽 越 宽 ， 介 
质 能 承载 的 信息 越 多 。 在 数字 通信 中 ， 带 宽 是 介质 承载 信息 能 力 的 术语 ， 用 bit/s 米 表 示 。 另 
外 一 个 重要 的 参数 是 误 码 率 (BER) ， 它 是 接收 到 的 错误 位 数 与 接收 到 的 总 位 数 之 比 。 如 果 信 
号 频率 超过 了 线路 的 信号 承载 能 力 ， 那 么 误 码 率 可 能 会 变 得 非常 高 ， 以 至 于 连接 的 设备 会 花费 
更 多 的 时 间 进 行 错误 恢复 ， 而 不 是 做 有 用 的 工作 。 

同 轴 电线 

同 轴 电缆 曾经 是 数据 通信 的 首选 介质 。 它 能 够 承载 每 秒 多 达 万 亿 个 周期 的 信号 ， 且 信号 衰 
减 小 。 今天， 它 主要 用 于 广播 和 闭路 电视 。 同 轴 电 缆 在 有 线 电 视线 路 上 还 承载 着 住宅 因特网 服 
务 的 信号 。 

同 轴 电 缆 的 中 心 是 粗 导线 (12 ~ 16 
号 ) ， 外 面包 了 一 层 名 叫绝 缘 体 的 绝缘 层 。 
绝缘 层 由 铝 稍 屏蔽 层 包 庄 ， 以 保护 它 不 受 
瞬 变 电磁 场 的 影响 。 铝 稍 屏 蔽 层 本 身 包 右 
在 钢 网 或 铜 网 中 为 电缆 提供 电气 接地 。 然 
后 ， 整 个 电缆 由 耐用 的 塑料 封套 包 庄 ( 见 
图 12-12)。 图 12-12 一 段 同 轴 电 缆 

用 于 有 线 电 视 的 同 轴 电 缆 称 为 宽带 电线， 因为 它 至 少 有 2Mbit/s 的 传输 能 力 。 宽 带 通 信使 
用 多 路 复 用 的 形式 为 数据 提供 通路 。 计 算 机 网 络 现在 很 少 使 用 窄带 电缆 ， 窄 带电 缆 通 道 的 典型 
带宽 是 64kbit/s。 

双 绞 线 

连接 两 台 计 算 机 的 最 容易 方式 就 是 在 它们 之 间 简 单 地 连 一 对 铜 线 。 其 中 一 根 导 线 用 于 发 送 
数据 ， 另 一 根 用 于 接收 数据 。 当 然 ， 两 个 系统 若 相距 越 远 ， 则 信和 号 就 要 越 强 ， 以 防止 信号 在 远 
距离 传输 中 由 于 衰减 而 导致 信号 漂 没 。 两 个 系统 之 间 的 距离 也 影响 数据 传输 的 速度 。 距 离 越 
远 ， 速度 越 慢 ， 这 样 可 以 避免 过 多 的 错误 。 使 用 较 粗 的 导线 ( 较 小 的 线 号 ) 可 以 减少 衰减 。 当 
然 ， 粗 线 比 细 线 贵 。 

除了 衰减 以 外 ， 电 缆 制造 商 也 受到 了 电感 现象 的 挑战 。 当 两 条 导线 处 于 完全 平行 且 彼 此 相 
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邻 的 状态 时 ， 导 线 中 的 强 高 频 信号 在 铜 导 线 周 围 会 产生 磁 ( 感 应 ) 场 ， 这 个 磁场 会 干扰 这 两 个 
线路 中 的 信号 。 

减 小 导体 间 电 感 的 最 简单 方法 是 把 它们 
拧 在 一 起 。 单 位 长 度 上 双 绞 线 扭转 的 次 数 越 
多 ,由 导线 相互 干扰 所 造成 的 衰减 就 越 小 。 
双 绞 线 比 非 双 绞 线 贵 ， 因 为 单位 长 度 上 消耗 
的 导线 更 多 ， 而 且 双 绞 线 必须 要 仔细 控制 。 
有 两 对 双 绞 线 的 双 绞 线 电 缆 ， 现 在 用 于 绝 大 
多 数 局 域 网 中 ( 见 图 12-13)。 双 绞 线 电缆 有 图 12-13 ” 双 绞 线 电费 
屏蔽 和 非 屏 蔽 两 种 形式 。 非 屏蔽 的 双 绞 线 是 最 常 使 用 的 。 

屏蔽 双 绞 线 电 缆 适 用 于 有 大 量 电 干 扰 的 环境 。 今 天 的 商业 环境 中 充斥 着 电磁 辐射 源 ， 这 些 
电磁 辐射 会 干扰 网 络 信 号 。 这 些 电 磁 辐 射 源 可 以 像 芝 光 灯 那样 看 似 无 害 ， 也 可 以 像 大 型 喻 喻 作 
响 的 电力 变压器 那样 明显 有 害 。 产 生 磁 场 的 任何 设备 都 有 可 能 干扰 网 络 通信 链 路 。 干 扰 会 限制 
网 络 的 速度 ， 因 为 信号 频率 越 高 对 信号 的 失真 越 敏 感 。 为 了 防止 环境 干扰 [ 称 为 电磁 干扰 
(EMI) 或 射频 干扰 (RFI) ] ， 可 以 安装 屏蔽 双 绞 线 以 帮助 在 恶劣 环境 中 维护 网 络 通信 的 完整 性 。 

对 于 是 否 值得 花费 更 多 的 材料 成 本 和 安装 成 本 来 获得 这 种 屏蔽 ， 专 家 们 的 意见 并 不 一 致 。 
他 们 指出 ， 如 果 屏 蔽 没有 正确 接地 ， 那 么 实际 上 与 它 所 解决 的 问题 相 比 ， 它 可 能 会 引起 更 多 的 
问题 。 具 体 来 说 ， 它 就 像 一 根 把 无 线 电 信号 吸引 到 导线 上 的 天 线 ! 

不 管 是 否 使 用 屏蔽 ， 网 络 导线 都 必须 具有 与 所 使 用 的 网 络 技术 相 适 应 的 信号 承载 能 力 。 
1991 年 ， 电 子 工业 联盟 (EIA) 和 电信 工业 协会 (TIA) 建 立 了 一 个 网 络 布线 分 级 系统 。 该 分 级 系 
统 的 最 新 版 本 是 EIA/TIA-568B。EIA/TIA 类 别 分 级 详细 说 明了 在 没有 过 度 衰减 的 情况 下 电缆 可 
以 支持 的 最 大 频率 。ISO 的 分 级 系统 将 这 些 线材 的 等 级 称 为 级 。 这 些 分 级 见 表 12-1。 目 前 大 多 
数 局 域 网 都 使 用 类 别 5 或 更 好 的 电缆 。 许 多 电缆 正在 用 光纤 代替 铜 ( 见 下 一 节 ) 。 

注意 ， 表 12-1 给 出 的 各 种 等 级 电缆 的 信号 承载 能 力 以 兆赫 兹 为 单位 。 兆 赫兹 不 同 于 兆 比 
特 。 正 如 在 2. A 节 所 看 到 的 ， 在 任何 给 定 频 率 上 携带 的 位 数 是 网 络 中 使 用 编码 方法 的 函数 。 运 
行 于 100Mbit/s 以 下 的 网 络 可 以 使 用 曼彻斯特 编码 ， 即 每 传输 1 位 信息 需要 翻转 两 次 信号 。 运 
行 于 100Mbit/s 及 以 上 的 网 络 使 用 不 同 的 编码 方案 ， 其 中 最 流行 的 是 4B/5B， 使 用 NRZI 编码 用 
5 波 特 表示 4 位 信息 ， 如 图 12-14 所 示 。 

表 12-1 EIA/TIA-568B 和 1SO 电线 








规格 


























1 类 声音 和 “低速 ”数据 (4 ~9. 6kHz) 
2 类 A 级 小 于 等 于 1Mbit/s 

3 关 B 级 虞 10MHz 

4 类 C 级 20MHz 

5 类 D 级 100MHz 

6 类 E 级 250MHz 

7 类 F 级 600MHz 








波 特 是 传输 介质 或 传输 方法 在 介质 上 支持 信号 跃迁 数 的 度量 单位 。 除 了 语音 电话 网 以 外 的 
网 络 ， 线 路 速度 用 赫兹 表示 ， 但 赫兹 和 波 特 在 数字 信号 上 是 等 价 的 。 正 如 在 图 12-14 中 所 看 到 
的 ， 如 果 网 络 使 用 4B/5B 编码 ， 那 么 125MHz 的 信号 承载 能 力 要 求 线路 有 100Mbits 的 位 率 。 

光线 

光纤 网 络 介 质 传输 的 信号 比 双 绞 线 或 同 轴 电 缆 更 快 、 更 远 。 理 论 上 光缆 可 以 支持 的 频率 为 
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太 赫 效 范 围 ， 但 传输 速度 通常 在 2GHz 范围 内 ,传输 距离 为 10 ~ 100km( 无 中 继 器 ) 。 光 缆 由 保 
护 塑 料 套 包 右 的 一 束 细 (1.5 ~125pum) 玻 璃 或 塑料 丝 组 成 。 虽 然 ， 光缆 中 的 物理 成 分 与 电缆 完 
全 不 同 , 但 是 可 以 把 光纤 看 作 光 的 导体 ， 就 像 铜 是 电 的 导体 一 样 。 光 缆 是 一 种 “ 光 导 ”， 它 把 
光线 从 光缆 的 一 端 引 导 到 男 一 端 。 在 发 送 端 ， 发 光 二 极 管 或 激光 二 极 管 就 像 水 通过 管道 一 样 通 
过 玻璃 丝 发 送 光 脉冲 。 在 接收 端 ， 光 检测 器 将 光 脉 冲 转换 成 电信 号 以 供电 子 设备 处 理 。 


开始 定 界 符 (JK ) 结束 定 界 符 (T) 








图 12-14 4B/5B 编码 


光纤 支持 3 种 不 同 的 传输 模式 ， 这 取决 于 所 使 用 的 光 
纤 类 型 。 光 纤 类 型 如 图 12-15 所 示 。 最 窗 的 单 模 光 纤 ， 只 
在 一 个 波长 上 传送 光 , 通常 波长 是 850nm、1300nm 或 
1500nm。 单 模 光 纤 允 许 的 传输 距离 最 长 ,传输 数据 速率 
最 快 。 

多 模 光 纤 通过 较 大 的 光纤 芯 可 以 同时 携带 多 个 不 同 波 
长 的 光 。 在 多 模 光 纤 中 ,光纤 芯 的 侧面 反射 激光 波 ， 这 会 
造成 比 单 模 光 纤 更 大 的 衰减 。 光 波 不 仅 发 生 散射 ， 而 且 在 图 12-15 光纤 
一 定 程度 上 还 会 相互 碰撞 ， 造 成 进一步 的 衰减 。 

多 模 渐变 折射 率 光 纤 也 同时 支持 多 个 波长 ， 但 是 它 比 常规 多 模 光 纤 更 可 控 。 多 模 渐变 折射 
率 光纤 由 同心 的 塑料 或 玻璃 层 组 成 ， 每 一 层 都 具有 折射 特性 ， 用 于 优化 特定 波长 的 光 。 与 常规 
多 模 光纤 一 样 ， 光 以 波 的 方式 通过 多 模 渐 变 折射 率 光纤 。 但 是 ， 与 多 模 光 纤 不 同 ， 波 会 被 限制 
在 适合 传播 特定 波长 的 区 域 。 因 此 ， 通 过 光纤 同时 传输 的 不 同 波长 不 会 互相 干扰 。 

光纤 介质 相 比 铜 介质 具有 许多 优点 ， 最 明显 的 是 它 具 有 巨大 的 信号 承载 能 力 。 它 也 不 受 





c ) 渐变 折射 率 
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EMI 和 RFI 的 影响 ， 所 以 非常 适合 在 工业 设施 中 进行 部 署 。 光 缆 体 积 小 、 重 量 轻 ,一 根 光纤 可 
以 替代 几 百 对 铜 线 。 

但 是 光缆 容易 损坏 ， 购 买 和 安装 成 本 高 。 因 此 ， 光 纤 最 常用 于 网 络 主干 线 缆 ， 这 种 线 缆 承 
载 着 成 百 上 千 的 用 户 。 主 干线 缆 就 像 是 一 条 州 际 高 速 公 路 ， 仅 限于 特定 的 人口 和 出 口 点 才能 进 
出 高 速 公 路 ， 但 是 大 量 的 运输 车 辆 可 以 高 速 通行 。 车 辆 要 想 达 到 最 终 目 的 地 ， 它 不 得 不 离开 高 
速 公 路 ， 或许 还 要 开车 穿 过 居民 区 的 街道 。 在 网 络 中 ， 类 似 于 居民 区 街道 的 网 络 通常 采用 双 绞 
线 铜 线 的 形式 。 这 种 “居民 区 街道 ” 铜 线 有 时 称 为 水 平 电线， 以 区 别 于 主干 电缆 ， 它 也 称 为 
垂直 电缆 。 训 无 疑问 ， 随 着 成 本 的 降低 ，“ 光 纤 到 桌面 ”最 终 将 成 为 现实 。 与 此 同时 ， 把 数 
据 、 语 音 和 视频 整合 到 同一 线 缆 上 的 需求 正在 稳步 增长 。 随 着 这 些 新 技术 的 部 署 ， 在 引入 下 一 
代 高 速 线 缆 之 前 ， 网 络 介质 可 能 会 使 用 到 极限 。 

无 线 介质 -无 线 数据 通信 

位 模式 可 以 在 任何 能 够 支持 信号 的 介质 中 传送 ， 因 此 ， 在 无 线 数据 通信 中 使 用 的 传输 硬件 
和 方法 千差万别 。 在 本 书 中 不 能 覆盖 所 有 的 传输 硬件 和 方法 。 但 是 ， 会 简单 介绍 在 日 常 活动 中 
最 常 遇 到 的 无 线 数据 通信 标准 ， 它 们 是 蜂 窗 无线 、 蓝 牙 和 802. 11x 系列 标准 。 

顾名思义 ， 蜂 帘 无 线 网 络 通过 蜂窝 电话 网 络 传输 数据 。 与 早期 的 住宅 电话 网 一 样 ， 蜂 窝 系 
统 并 不 打算 成 为 数据 网 络 。 因 此 ， 所 谓 的 第 一 代 和 第 二 代 蜂 窜 数 据 传输 网 络 的 功能 和 传输 速度 
(通常 在 0.3 ~1Mbit/s 之 间 ) 有 限 。 建 立 宽带 蜂窝 服 务 确实 有 很 大 的 好 处 ， 就 像 在 有 线 介 质 ( 有 
线 电视 和 电话 ) 上 建立 宽带 住宅 服务 一 样 。 考 虑 到 这 一 点 ，ITU 已 经 定义 了 第 三 代 无 线 通信 结 
构 ， 通 常 称 为 3G。3G 的 功能 包括 高 达 2. 048Mbit/s 的 数据 速率 ， 为 各 种 各 样 设备 提供 支持 ， 
并 把 低地 球 轨道 (LEO) 卫 星 集成 到 统一 系统 中 。 虽 然 访问 速度 可 能 会 有 所 不 同 ， 但 随 着 36 的 
发 展 ， 万 维 网 最 终 将 向 全 世界 开放 。 

蓝牙 ， 也 称 为 卫 EE 802. 15. 1 一 2002 ， 由 爱立信 公司 于 1994 年 提出 。 蓝 牙 是 十 世纪 一 个 国 
王 的 名 字 ， 他 以 结束 在 丹麦 、 挪 威 和 瑞典 的 许多 部 落 之 间 的 敌对 战争 而 闻名 。 蓝 牙 的 类 似 目的 
是 汇集 不 同 的 技术 以 连接 很 短 距 离 内 的 计算 机 和 其 他 设备 ， 通 常 称 为 个 域 网 ( PAN) ， 或 微微 
网 。 第 一 个 蓝牙 规范 是 于 1999 年 由 爱立信 、IBM 、Itel 、 诺 基 亚 和 东芝 共同 发 布 的 。 

蓝牙 网 络 由 主 设备 和 多 达 七 个 从 设备 组 成 ， 主 设备 以 循环 方式 与 从 设备 进行 通信 。 在 非常 
规 的 2. 45GHz 频率 下 ， 以 720Kbit/s 速率 传输 数据 ， 所 消耗 的 功率 非常 低 (不 超过 100mW ) 。 蓝 
牙 技 术 非 常 流行 ， 它 可 以 将 便携 式 计 算 设 备 ( 如 平板 电脑 、PDA 和 手机 ) 连 接 到 各 种 外 围 设 备 
上 ， 而 不 需要 使 用 占用 便携 式 设备 宝贵 空间 的 电线 或 电缆 插座 。 

无 线 局 域 网 ( WLAN) 比 有 线 局 域 网 慢 得 多 ， 但 它们 提供 了 许多 用 途 广 泛 的 好 处 。 其 中 最 重 
要 的 一 点 是 ， 一 个 网 络 可 以 在 任何 地 方 建立 ， 并 且 可 以 相当 方便 地 重新 配置 。 自 从 1997 年 第 1 
版 标准 问世 以 来 ，WLAN 的 IEEE 802. 11 系列 标准 一 直 稳 步 增长 。 在 表 12-2 中 提供 了 这 个 标准 
各 个 部 分 的 简要 介绍 。 


表 12-2 1IEEE 802. 11 无 线 网 络 标准 
































IEEE 规范 下 说明， 
802. 11-2007 基本 的 无 线 标准 包括 修改 版 a ~j 和 802. 11. RevMA 
802. 11k-2007 无 线 资源 管理 以 允许 诸如 漫游 等 服务 的 远程 管理 
802. 11n-2009 在 室内 250ft(1ft =0.3048m) 范 围 内 ,在 2.4GHz 和 5GHz 频段 上 ， 改 善 吞 吐 量 可 以 高 达 
600Mbit/s 
802. 11p-2010 | 专 为 汽车 和 其 他 车 辆 在 5. 9GHz 频带 上 所 进行 的 扩展 
802. 11r-2008 快速 漫游 : 允许 在 基站 之 间 可 靠 地 切换 以 适应 运动 中 的 无 线 设备 ( 比如 在 汽车 中 ) 
802. 11s-2010 无 线 网 状 网 络 
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802. 11u-2010 
802. 11v-2010 
802. 11. w-2009 
802. 11. y-2008 


与 非 802 网 络 ( 如 3G 蜂窝 网 ) 互通 
无 线 网 络 管理 

无 线 局 域 网 管理 帧 保护 

无 线 局 域 网 在 3650MHz 频段 上 的 MAC 层 增强 
















一 个 典型 的 无 线 局 域 网 由 一 个 或 多 个 相互 连接 的 ( 硬件) 无 线 接 入 点 (WAP ) 组 成 ,无线 接 
人 点 把 数据 广播 到 网 络 的 节点 上 。 节 点 通过 分 配给 它 的 频率 在 会 话 持续 期 间 保持 连接 或 者 直到 
连接 断 开 为 止 。WAP 的 覆盖 范围 受到 环境 中 的 电磁 干扰 和 诸如 墙壁 和 家 具 等 障碍 物 的 影响 。 
一 般 来 说 ， 无 线 网 络 的 数据 传输 速度 越 快 ， 它 越 容易 受到 障碍 物 的 影响 ,传输 距离 也 就 越 短 。 
离 WAP 最 远 的 节点 吞吐 量 最 低 ， 因 为 传输 速度 被 降低 以 适应 更 远 的 距离 。 

安全 是 无 线 网 络 中 一 个 持续 存在 的 问题 。 采 取 一 定 的 措施 可 以 使 未 经 授权 的 访问 变 得 困 
难 ， 例 如 使 用 128 位 的 有 线 等 效 保 密 ( WEP) 加密 模 式 。 然 而 ， 安 全 专家 警告 说 ， 要 阻止 一 个 
坚定 和 富有 经 验 的 黑客 是 不 可 能 的 。 如 果 安 全 是 一 个 令 人 担心 的 问题 ， 那 么 任何 形式 的 无 线 网 
络 都 应 该 极其 小 心地 部 署 。 即 使 是 微微 网 也 可 以 为 恶意 访问 整个 企业 网 络 打 开 大 门 。 


12. 6.2 接口 卡 


传输 介质 通过 网 络 接口 与 客户 端 、 主 机 和 其 他 网 络 设备 相连 。 因 为 这 些 接口 通常 是 实现 在 
可 拆 印 的 电路 板 上 的 ， 所 以 它们 通常 称 为 网 络 接口 卡 ， 或 简称 NIC。( 请 不 要 说 “NIC 卡 ”!) 
NIC 通常 包括 OSI 协议 栈 的 最 低 三 层 。 它 是 网 络 物理 部 件 与 计算 机 系统 之 间 的 桥梁 。NIC 直接 
连接 到 系统 的 主 总 线 或 专用 IO 总 线 上 。 它 们 将 在 系统 总 线 上 传递 的 并 行 数据 转换 为 在 通信 介 
质 上 广播 的 串 行 信号 。NIC 把 数据 的 编码 从 二 进 制 转变 为 到 曼彻斯特 编码 或 4B/5B 编码 (反之 
亦 然 ) 。 它 也 提供 物理 连接 和 信和 号 匹配 ， 以 便 把 信和 号 放置 到 网 络 介质 上 。 

每 个 网 卡 都 有 一 个 唯一 烧 录 到 电路 中 的 物理 地 址 。 这 个 地 址 称 为 介质 访问 控制 ( MAC ) 地 
址 ， 长 度 为 6 字 节 。 前 3 字 节 是 制造 商 的 标识 号 ， 它 由 IEEE 指定 。 后 3 字 节 是 由 制造 商 分 配 
给 NIC 的 唯一 标识 符 。 世 界 上 任何 地 方 的 两 个 网 卡 都 不 应 该 有 相同 的 MAC 地 址 。 网 络 协议 层 
将 这 个 物理 MAC 地 址 至 少 映射 为 一 个 逻辑 地 址 。 逻 辑 地 址 是 这 个 节点 被 网 络 上 其 他 节点 看 到 
的 名 字 或 地 址 。 一 个 计算 机 (逻辑 地 址 ) 可 以 有 两 个 或 两 个 以 上 的 网 卡 ， 但 每 个 网 卡 只 有 一 个 
不 同 的 MAC 地 址 。 


12. 6.3 中 继 器 


在 小 型 办 公 室 局 域 网 中 ，NIC 之 间 的 距离 只 有 几 英 矿 。 然 而 ， 在 复杂 的 办 公 室 ，NIC 之 间 
可 能 有 几 百 英尺 的 电缆 。 电 缆 越 长 ， 信 和 号 衰减 越 大 。 降 低 传输 速度 (通常 这 是 不 可 接受 的 选 
择 ) 或 在 网 络 中 增加 中 继 器 可 以 减少 衰减 的 影响 。 中 继 器 用 放大 信号 来 抵消 通过 网 络 线路 时 的 
衰减 。 网 络 所 需 的 中 继 器 数量 取决 于 所 传输 信号 的 距离 、 所 使 用 的 介质 和 线路 的 信 令 速度 。 例 
如 ， 使 用 高 频 铜 线 每 公里 需要 的 中 继 器 比 使 用 光缆 需要 得 多 。 

中 继 器 是 网 络 介质 的 一 部 分 。 从 理论 上 讲 ， 它 们 是 完全 不 需要 人 工 干预 的 设备 。 因 此 ， 它 
们 不 包含 网 络 可 寻 址 部 件 。 然 而 ， 有 些 中 继 器 现在 提供 高 层 服务 以 辅助 网 络 管理 和 排除 故障 。 
图 12-16 所 示 为 中 继 器 是 如 何 再 生 衰 减 的 数字 信号 的 。 


12. 6.4 ”集线器 
中 继 器 是 有 一 个 输入 端口 和 一 个 输出 端口 的 物理 层 设备 。 集 线 器 也 是 物理 层 设备 ,但 它们 
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可 以 有 许多 端口 用 于 输入 和 输出 。 它 们 从 一 个 或 多 个 位 置 接收 数据 包 ， 并 将 这 些 数据 包 广 播 到 
网 络 上 的 一 个 或 多 个 设备 。 集 线 器 允许 计算 机 连接 成 网 段 。 最 简单 的 集线器 无 非 是 连接 网 络 各 
个 分 支 的 中 继 器 。 由 集线器 连 在 一 起 的 物理 网 络 分 支 不 以 任何 方式 对 网 络 进行 分 区 ， 它 们 是 纯 
粹 的 第 一 层 设 备 ， 不 知道 数据 包 的 源 或 目的 地 。 网 络 上 的 每 个 工作 站 不 断 地 与 网 络 上 的 其 他 工 
作 站 竞争 带宽 ， 而 不 管 存在 或 不 存在 中 间 集 线 器 。 由 于 集线器 是 第 一 层 设 备 ， 所 以 在 集线器 的 
所 有 端口 上 物理 介质 必须 相同 。 可 以 把 简单 的 集线器 视 为 对 物理 网 络 提供 多 站 访问 的 中 继 器 。 
图 12-17 展示 了 一 个 有 3 个 集线器 的 网 络 。 





一 一 一 > 
衰减 的 信号 中 继 器 再 生 的 信号 


图 12-16 在 0SI 参考 模型 中 一 个 中 继 器 的 功能 


随 着 集线器 体系 结构 的 发 展 ， 许 多 集 线 
器 现在 可 以 连接 不 同 的 物理 介质 。 虽 然 这 样 
的 介质 互 连 属于 第 二 层 功 能 ， 但 是 制造 商 仍 
然 称 这 些 设备 为 “集线器 ”"。 交 换 集线器 和 
智能 集线器 与 属于 “第 一 层 设备 ”的 集 线 
器 在 概念 上 有 比较 大 的 差别 。 这 些 复杂 的 组 
件 不 仅 连接 不 同 的 介质 ， 而 且 也 执行 基本 的 图 12-17 用 集线器 连接 的 网 络 
路 由 和 协议 转换 ， 这 些 都 是 第 三 层 的 功能 。 


12. 6.5 交换 机 


交换 机 是 第 二 层 设 备 ， 在 交换 机 的 一 个 输入 端口 和 一 个 输出 端口 之 间 可 以 建立 点 到 点 的 连 
接 。 虽 然 集线器 和 交换 机 执行 相同 的 功能 ， 但 它们 的 内 部 数据 的 处 理 方式 不 同 。 集 线 器 将 数据 
包 广 播 到 网 络 的 所 有 计算 机 上 ， 每 次 只 处 理 一 个 数据 包 。 男 一 方面 ， 交 换 机 可 以 处 理 连 接 到 计 
算 机 和 它们 之 间 的 多 个 通信 。 如 果 网 络 上 只 有 两 台 计 算 机 ， 那 么 集线器 和 交换 机 的 运行 方式 完 
全 相同 。 如 果 有 两 台 以 上 的 计算 机 试图 在 网 络 上 进行 通信 ， 那 么 交换 机 可 以 提供 更 好 的 性 能 ， 
因为 交换 机 的 两 端 都 可 以 获得 全 部 带宽 。 因 此 ， 在 大 多 数 网 络 设备 中 ， 相 对 于 集线器 而 言 更 倾 
向 于 选择 交换 机 。 在 第 9 章 中 ,我们 介绍 了 连接 处 理 器 到 存储 器 或 处 理 器 到 处 理 器 的 交换 机 。 
那些 交换 机 与 我 们 在 这 里 讨论 的 交换 机 属于 同一 类 型 。 交 换 机 包含 一 些 缓冲 输入 端口 、 相 同 数 
量 的 输出 端口 、 一 个 交换 结构 (交换 单元 的 组 合 、 所 包含 的 集成 电路 以 及 允许 交换 路 径 控制 的 
程序 ) 和 数字 硬件 ( 当 网 络 帧 到 达 输 入 缓冲 区 时 用 于 解释 网 络 帧 上 的 地 址 信息 编码 ) 。 

与 大 多 数 我 们 已 经 讨论 的 网 络 部 件 相 同 ， 交 换 机 已 经 通过 增加 可 寻 址 能 力 和 管理 功能 得 到 
了 改善 。 现 在 大 多 数 交 换 机 都 可 以 报告 它们 正在 处 理 的 业务 流量 和 类 型 ， 甚 至 可 以 根据 用 户 提 
供 的 参数 过 滤 某 些 网 络 包 。 由 于 所 有 的 交换 功能 都 是 由 硬件 完成 的 ， 所 以 交换 机 是 连接 高 性 能 
网 络 部 件 的 首选 设备 。 


12. 6.6 网 桥 和 网 关 
网 桥 和 网 关 的 目的 都 是 在 两 个 不 同 的 网 段 之 间 提 供 一 个 链 路 。 它 们 都 能 够 支持 不 同 的 介质 
《和 网 速 ) ， 而 且 它们 都 是 “存储 和 转发 ”设备 ， 在 发 送 帧 之 前 要 先 把 一 个 完整 的 帧 保存 起 来 。 
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但 是 ， 它 们 只 有 这 些 相似 之 处 。 

网 桥 连接 两 种 类 型 相似 的 网 络 ， 所 以 它们 看 上 去 像 一 个 网 络 。 有 了 网 桥 ， 网 络 上 的 所 有 计 
算 机 都 属于 同一 个 子 网 (由 具有 相同 卫 地 址 前 缀 的 所 有 设备 组 成 的 网 络 )。 网 桥 是 相对 简单 的 
设备 ， 其 功能 主要 在 第 二 层 。 这 意味 着 它们 对 协议 一 无 所 知 ， 只 不 过 是 根据 目的 地 地 址 转发 数 
据 。 网 桥 可 以 连接 不 同 的 介质 ， 它 们 有 不 同 介质 访问 控制 协议 ， 但 是 在 两 个 段 中 0SI 栈 的 这 个 
协议 从 MAC 层 到 所 有 更 高 层 都 必须 一 样 。 这 种 关系 如 图 12-18 所 示 。 





图 12-18 用 一 个 网 桥 连接 两 个 网 络 


连接 到 任何 特定 网 桥 上 的 节点 必须 有 一 致 的 地 址 。( 最 常用 的 就 是 MAC 地 址 。) 网 络 管理 员 
必须 用 网 络 中 每 个 有 效 节 点 的 地 址 和 网 段 编号 给 简单 网 桥 编程 。 只 有 人 允许 跨越 网 桥 的 数据 才 是 
发 送 到 网 桥 另 一 端 有 效 地 址 的 数据 。 对 于 频繁 变化 的 大 型 网 络 ( 绝 大 多 数 网 络 ) ， 这 种 不 断 的 
重新 编程 既 繁 琐 耗 时 ， 又 容易 出 错 。 透 明 网 桥 的 发 明 缓 解 了 这 一 问题 。 它 们 是 能 够 记 住 每 个 网 
段 上 每 个 设备 地 址 的 复杂 设备 。 透 明 网 桥 还 可 以 提供 诸如 吞吐 量 报告 等 管理 信息 。 这 样 的 功能 
意味 着 网 桥 并 不 完全 是 第 二 层 设备 。 然 而 ， 网 桥 仍然 需要 相同 的 网 络 层 协议 和 在 两 个 互 接 段 上 
相同 的 接口 。 

图 12-18 所 示 为 两 个 不 同类 型 的 局 域 网 通过 一 个 网 桥 相 互 连 接 的 情况 。 这 是 典型 的 使 用 网 桥 
的 方式 。 然 而 ， 如 果 这 些 局 域 网 上 的 用 户 需要 连接 到 使 用 完全 不 同 协议 的 系统 上 (例如 公用 交换 
电话 网 络 或 使 用 非 标准 专用 协议 的 主机 ) ， 则 需要 网 关 。 网 关 是 进入 到 另 一 个 网 络 的 一 个 点 。 网 
关 是 功能 齐全 的 计算 机 ， 能 提供 跨越 OSI 七 层 协议 的 通信 服务 。 网 关系 统 软件 可 转换 协议 和 字符 
编码 ， 并 能 提供 加 密 和 解密 服务 。 因 为 网 关 用 软件 做 了 很 多 工作 ， 所 以 网 关 不 能 提供 基于 硬件 网 
桥 的 吞吐 量 ， 但 是 可 以 通过 提供 大 量 的 功能 来 弥补 。 网 关 通 常 直接 连接 到 交换 机 和 路 由 器 上 。 


12. 6.7 路 由 器 和 路 由 


除了 网 关 ， 路 由 器 是 网 络 中 另 一 个 很 复杂 的 部 件 。 实 际 上 路 由 器 是 小 型 专用 计算 机 。 路 由 
器 是 一 种 至 少 连接 两 个 网 络 的 设备 (或 软件 ) ， 它 决定 一 个 数据 包 应 该 转发 到 的 目的 地 址 。 路 
由 器 一 般 位 于 网 关 的 位 置 。 如 果 管 理 得 好 ， 那 么 路 由 器 可 以 提升 网 络 速度 。 如 果 管 理 得 不 好 ， 
那么 一 个 有 问题 的 路 由 器 可 以 使 整个 网 络 运行 异常 。 在 本 节 中 ,将 揭示 路 由 器 的 内 部 工作 原 
理 ， 并 讨论 对 于 路 由 器 需要 解决 的 棘手 问题 。 

尽管 路 由 器 很 复杂 ， 但 它们 通常 称 为 第 三 层 设 备 ， 因 为 它们 的 大 部 分 工作 都 是 在 OSI 参考 
模型 的 网 络 层 上 完成 的 。 然 而 ， 大 多 数 路 由 器 也 提供 了 一 些 网 络 监控 、 管 理 和 故障 排除 服务 。 
由 于 路 由 器 是 第 三 层 设备 ， 所 以 它们 可 以 桥接 不 同 的 网 络 介质 类 型 (如 光纤 到 铜 线 ) ， 并 连接 
运行 在 第 三 层 及 以 下 各 层 的 不 同 网 络 协议 。 基 于 路 由 器 所 能 完成 的 功能 ， 有 时 在 因特网 标准 文 
献 中 称 其 为 “中 间 系 统 ” 或 “网 关 "。( 在 写 第 一 个 因特网 标准 时 ， 还 没有 路 由 器 这 个 词 。) 

路 由 器 是 专门 设计 连接 两 个 网 络 的， 通常 是 从 局 域 网 到 广域网 。 路 由 器 是 复杂 的 设备 ， 因 
为 它们 不 仅 包含 缓冲 区 和 交换 逻辑 ， 它 们 还 有 足够 的 内 存 和 处 理 能 力 来 计算 将 数据 包 发 送 到 目 
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的 地 的 最 佳 路 径 。 一 个 路 由 器 的 内 部 概念 模型 如 图 12-19 所 示 。 





图 12-19 路 由 器 的 剖析 


在 大 型 网 络 中 ， 路 由 器 为 一 个 基本 
NP 完全 问题 找 出 了 一 个 近似 解 。 一 个 NP 
完全 问题 是 指 在 理论 上 不 能 在 足够 短 的 时 
间 内 得 出 最 优 解 的 问题 。 

考虑 图 12-20 所 示 的 网 络 。 你 可 能 认 
识 这 个 图 ， 这 是 一 个 完全 图 (K;)。 在 一 个 
包含 个 节点 的 完全 图 中 有 n(n -1)Z2 条 
边 。 在 这 个 例子 中 ， 有 5 个 节点 和 10 条 
边 。 这 些 边 表示 节点 之 间 的 路 径 或 跳 。 

如 果 节 点 1 路 由 器 1) 需 要 发 送 一 个 
数据 包 到 节点 2， 那 么 节点 1 有 下 列 路 径 
选择 : 


一 跳 的 一 条 路 径 : 

1 一 2 

两 跳 的 三 条 路 径 : 

1 一 3 一 "2 1 一 4 一 "2 

三 跳 的 六 条 路 径 : 

1—3—4—2 1—3—5—2 
1—4—3—»2 1—5—3—2 
四 跳 的 六 条 路 径 : 

1—3—4—5—2 1] 一 4 一 3 一 "59 一 2 
1 一 3 一 :一 人 4 一 2 1 一 4 一 5 一 :3 一 2 





至 终端 工作 站 


图 12-20 一 个 全 连接 网 络 


1—5—2 


1—5—4—»2 
1—4—5—2 


1 一 一 4 一 ”3 一 ”2 
1 一 ”一 3 一 4 一 "2 


当 节点 1 和 节点 2 没有 直接 连接 时 ， 它 们 之 间 的 通信 必须 至 少 经 过 一 个 中 间 节 点 。 如 果 考 
虑 所 有 的 选择 ， 那 么 可 能 的 路 径 数量 会 非常 大 。 当 给 路 径 增加 成 本 或 权重 因素 时 ， 这 个 问题 会 
进一步 复杂 化 。 更 糟糕 的 是 ， 这 个 权重 会 随 着 业务 流量 而 变化 。 例 如 ， 如 果 节 点 1 和 节点 2 之 
间 的 连接 是 一 个 高 延迟 ( 慢 ) 链 路 ， 那 么 使 用 14 一 5 一 3 一 2 这 条 路 径 可 能 会 更 好 。 显 然 ， 在 一 
个 有 数 百 个 路 由 器 的 真实 网 络 中 ， 这 个 问题 会 变 得 更 加 棘手 。 如 果 每 个 路 由 器 都 要 为 每 个 传人 
的 数据 包 在 所 有 可 能 的 路 径 中 找到 完美 的 传 出 路 由 ， 那 么 这 个 数据 包 将 永远 不 会 到 达 本 来 可 以 
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很 快 就 能 到 达 的 地 方 。 

当然 ， 在 只 有 几 个 节点 的 非常 稳定 的 网 络 中 ， 可 以 对 每 个 路 由 器 进行 编程 ， 使 其 始终 使 用 
相同 的 最 优 路 由 。 这 称 为 静态 路 由 ， 它 对 于 网 络 中 一 个 位 置 有 大 量 用 户 而 另 一 个 位 置 使 用 一 台 
中 央 主 机 或 网 关 的 情况 是 可 行 的 。 在 短期 内 ， 这 是 一 种 有 效 连 接 系 统 的 方法 ， 但 是 如 果 互 连 链 
路 中 的 一 个 链 路 出 现 问题 或 一 个 路 由 器 出 现 问题 ， 那 么 用 户 就 会 与 主机 断 开 连接 。 人 们 必须 快 
速 响应 以 便 恢复 服务 。 对 于 变化 频繁 的 网 络 ， 静 态 路 由 并 不 是 一 种 合理 的 选择 。 这 就 是 说 ， 大 
多 数 网 络 不 会 选择 静态 路 由 。 相 反 ， 静 态 网 络 是 可 预测 的 ， 因 为 数据 包 的 路 径 ( 因此 跳 数 ) 总 
是 已 知 的 并 且 可 控 。 静 态 路 由 也 是 非常 稳定 的 ， 并且 它 创建 了 无 路 由 协议 交换 流量 。 

动态 路 由 器 自动 设置 路 由 和 应 对 网 络 中 的 变化 。 路 由 器 也 可 以 选择 一 条 最 佳 路 由 以 及 一 条 
备用 路 由 ， 这 样 当 所 选 路 由 发 生 某 些 情况 时 可 以 使 用 它 。 它 们 不 改变 路 由 指令 ， 而 是 允许 动态 
地 改变 路 由 表 。 

动态 路 由 器 通过 与 网 络 上 的 其 他 路 由 器 交换 信息 自动 地 探测 网 络 。 路 由 器 交换 的 信息 包 包 
含 了 它们 的 地 址 ， 以 及 从 一 个 点 到 另 一 个 点 的 网 络 状 况 。 路 由 器 使 用 这 些 信息 在 主 存 中 建立 一 
个 路 由 表 。 实 际 上 ， 这 个 路 由 表 是 网 络 上 每 个 节点 的 一 个 可 达 性 列表 ， 加 上 一 些 缺 省 值 。 通 
常 ， 路 由 表 中 列 出 的 每 个 目标 节点 都 与 相 邻 的 或 下 一 跳 路 由 器 相连 接 。 

当 创建 路 由 表 时 ， 动 态 路 由 器 考虑 了 两 个 度量 指标 中 的 一 个 。 它 们 可 以 使 用 两 个 节点 之 间 
的 传输 距离 ， 也 可 以 使 用 由 延迟 表示 的 网 络 状 况 。 使 用 第 一 种 度量 指标 的 算法 是 距离 向 量 路 由 
算法 。 使 用 第 二 种 度量 指标 的 算法 是 链 路 状态 路 由 算法 。 

距离 向 量 路 由 算法 来 源 于 1957 年 和 1962 年 提出 的 贝尔 曼 - 福特 (Bellman-Ford) 和 福特 - 
富 尔 克 森 ( Ford-Fulkerson ) 两 个 相似 算法 。 距 离 向 量 路 由 算法 中 的 距离 通常 是 一 个 数据 包 到 达 
目的 地 之 前 必须 经 过 的 节点 数 ( 跳 数 ) 的 度量 指标 ,但 是 可 以 使 用 任何 度量 指标 。 例 如 ,假设 
有 图 12-21a 所 示 的 网 络 。 图 中 有 4 个 路 由 器 和 10 个 相连 的 节点 。 如 果 节 点 B 向 发 送 一 个 数据 
包 到 节点 L， 那 么 有 两 种 选择 : 一 种 选择 是 B 一 路 由 器 4 一 路 由 器 1 一 L， 其 中 路 由 器 4 和 路 由 
器 1 之 间 有 一 跳 ; 男 一 种 选择 是 B 一 路 由 器 4 一 路 由 器 3 一 路 由 器 2 一 路 由 器 1 一 L; 在 路 由 器 之 
间 有 三 跳 。 距 离 向 量 路 由 算法 的 目标 是 始终 使 用 最 短路 径 ， 所 以 B 一 路 由 器 4 一 路 由 器 1 开路 
径 是 显而易见 的 选择 。 

在 距离 向 量 路 由 中 ， 每 个 路 由 器 都 需要 知道 连接 到 路 由 器 的 每 个 节点 的 身份 以 及 它们 之 间 
的 跳 数 。 为 了 有 效 地 做 到 这 一 点 ， 路 由 器 与 相 邻 的 路 由 器 交换 节点 和 跳 数 信息 。 例 如 ， 使 用 
图 12-21a 所 示 的 网 络 ， 路 由 器 1 和 路 由 器 3 的 路 由 表 如 图 12-21b 所 示 。 然 后 这 些 路 由 表 发 送 
给 路 由 器 2。 如 图 中 所 示 ， 路 由 器 2 根据 路 由 表 给 出 的 所 有 路 由 ， 选 择 到 每 个 节点 的 最 短路 径 。 
最 终 的 路 由 表 包 含 直 接连 接 到 路 由 器 2 的 节点 地 址 ， 以 及 通过 其 他 路 由 器 可 到 达 的 目的 节点 列 
表 和 到 这 些 节点 的 跳 数 。 注 意 ， 在 路 由 器 2 的 最 终 路 由 表 中 ， 跳 数 比 原来 路 由 表 增 加 了 1， 因 
为 要 考虑 路 由 器 2 和 路 由 器 1 之 间 以 及 路 由 器 2 和 路 由 器 3 之 间 的 1 跳 距离 。 实 际 的 路 由 表 也 
将 包含 一 个 默认 的 路 由 器 地 址 ， 该 地 址 用 于 未 直接 连接 到 网 络 的 节点 ， 比 如 像 连接 在 远程 LAN 
或 因特网 目的 地 的 工作 站 等 。 

距离 向 量 路 由 算法 容易 实现 ， 但 它 确实 存在 一 些 问题 。 一 方面 ， 在 一 个 大 型 网 络 中 路 由 表 
的 稳定 (或 收敛 ) 可 能 需要 很 长 时 间 。 此 外 ,在 更 新 路 由 表 时 ， 有 相当 多 的 流量 会 放置 到 网 络 
上 。 第 三 ， 过 时 的 路 由 可 能 依然 在 路 由 表 中 ， 这 会 导致 数据 包 误 转 或 于 包 。 最 后 一 个 问题 是 无 
限 计数 问题 。 

通过 研究 图 12-22a 所 示 的 网 络 ， 可 以 理解 无 限 计 数 问题 。 注 意 ， 有 和 元 路 径 通 过 这 个 网 络 。 
还 要 注意 ， 通 过 内 联网 的 路 径 需 要 3 跳 。 例 如 ， 如 果 路 由 器 3 处 于 离线 状态 ， 那 么 客户 端 仍然 
可 以 访问 主机 和 因特网 ， 但 在 路 由 器 3 再 次 运行 之 前 ， 客 户 端 将 无 法 打印 任何 内 容 。 
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b) 使 用 路 由 器 1 和 路 由 器 3 的 路 由 表 为 路 由 器 2 构建 路 由 表 
图 12-21 


在 图 12-22b 中 列 出 了 从 所 有 路 由 器 到 因特网 的 路 径 。 我 们 称 这 个 快照 的 时 间 是 上 =0。 正 
如 你 所 看 到 的 ， 路 由 器 1 和 路 由 器 2 使 用 路 由 器 3 到 达 因 特 网 。 有 时 在 1=0 和 41=1 之 间 ， 路 
由 器 3 和 路 由 器 4 之 间 的 链 路 坏 了 (比如 说， 有 人 拔 掉 了 连接 这 些 路 由 器 的 电缆 ) 。 在 上 =1 时 ， 
路 由 器 3 发 现 这 个 问题 ， 但 是 它 刚刚 接收 到 来 自 邻居 节点 的 路 由 更 新 ， 这 两 个 节点 的 信息 都 显 
示 它 们 可 以 通过 2 跳 达 到 因特网 。 路 由 器 3 然后 假设 它 可 以 使 用 这 两 个 路 由 器 中 的 一 个 达到 因 
特 网 ， 并 相应 地 更 新 它 的 路 由 表 。 它 选择 路 由 器 1 作为 到 因特网 的 下 一 跳 。( 从 路 由 器 1 到 路 
由 器 3 是 1 跳 ， 所 以 从 路 由 器 3 到 因特网 的 跳 数 是 1+2 =3。) 在 1=2 时 ， 路 由 器 3 发 送 它 的 路 
由 表 给 路 由 器 1 和 路 由 器 2。 在 上 =3 时 ， 路 由 器 1 和 路 由 器 2 收 到 路 由 器 3 到 达 因 特 网 的 更 新 
的 跳 数 ， 所 以 它们 对 路 由 器 3 的 值 加 1( 因为 它们 知道 与 路 由 器 3 的 距离 是 1 跳 ) 。 并 且 接 着 广 
播 它 们 的 路 由 表 。 这 个 循环 继续 进行 ， 直 到 所 有 的 路 由 器 以 无 穷 大 的 跳 数 结束 ， 这 意味 着 寄存 
器 中 的 跳 数 最 终 会 溢出 ， 并 破坏 整个 网 络 。 

通常 使 用 两 种 方法 防止 发 生 这 种 情况 。 一 种 方法 是 使 用 一 个 非常 小 的 值 ， 以 便 在 早期 检测 
出 问题 (在 寄存 器 溢出 之 前 ) ; 男 一 种 方法 是 以 某 种 方法 防止 出 现 例 子 中 出 现 的 短 循环 情况 。 
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b) 4 个 路 由 器 看 到 的 c) 路 由 器 3 (R3) 检测 d ) R3 通 过 R1 找 到 路 由 ， 然 后 发 
到 达 因 特 网 的 路 由 到 断 开 链 路 布 到 达 因 特 网 的 3 跳 路 由 








时 间 :=3 时 间 := 4 时 间 := 5 

e) 其 他 路 由 器 知道 它们 需 f) R3 现 在 看 到 R1 和 因特网 g ) 当 R1 和 R2 收 到 R3 的 路 由 通 
要 R3 以 到 达 因特网 ， 根 之 间 的 距离 是 s， 所 以 对 知 时 ， 就 用 R3 到 因特网 的 
据 R3 的 报告 更 新 路 由 表 R1 的 跳 数 加 1， 以 更 新 自 跳 数 来 更 新 它们 的 路 由 表 。 
以 反映 到 达 因 特 网 的 新 己 到 达 因 特 网 的 路 由 这 个 过 程 持续 进行 ， 直 到 
距离 计数 器 溢出 


图 12-22 a) 一 个 有 元 余 路 径 的 网 络 ; b) 路 由 器 1、 路 由 器 2 和 路 由 器 3 到 达 因 特 网 的 路 由 ; 


c-g) 路 由 表 对 达到 因特网 路 径 的 更 新 





复杂 的 路 由 器 使 用 一 种 名 为 水 平分 割 路 由 的 方法 避免 网 络 中 的 短 循环 。 这 个 想法 很 简单 : 
没有 路 由 器 会 使 用 邻居 给 出 的 包含 它 自己 的 路 由 。( 类 似 的 ， 路 由 器 可 以 继续 使 用 自 引用 路 由 ， 
但 应 将 路 径 值 设置 为 无 穷 大 。 这 称 为 带 毒 型 反 转 的 水 平分 割 。 这 个 路 由 “中 毒 ” 了 ， 因 为 它 
被 标记 为 不 可 到 达 。) 对 于 例子 中 到 达 因 特 网 的 路 径 使 用 水 平分 割 路 由 方法 交换 路 由 表 将 会 收 
敛 ， 如 图 12-23 所 示 。 当 然 ， 我 们 仍然 有 出 现 大 循环 的 问题 。 比 如 ， 路 由 器 1 指向 路 由 器 2， 
路 由 器 2 指向 路 由 器 3， 路 由 器 3 指向 路 由 需 1。 在 某 种 程度 上 ， 如 果 路 由 器 只 在 需要 更 新 链 
路 时 交换 它们 的 路 由 表 ， 那 么 这 个 问题 就 可 以 解决 。( 这 就 是 所 谓 的 触发 更 新 。) 用 这 种 方式 进 
行 更 新 在 路 由 图 中 引起 的 循环 会 很 少 而 且 也 减少 了 网 上 的 流量 。 





时 间 := 1 时 间 t= 2 时 间 t=3 
a ) R3 检 测 到 在 到 因特网 b ) 因为 到 因特网 的 所 有 路 由 c ) R3 现 在 看 到 的 到 达 因 特 网 
的 路 径 中 有 失效 链 路 都 包含 R3 ， 所 以 它 把 到 因 的 最 短路 由 是 通过 R1， 然 
特 网 的 跳 数 标记 为 无 穷 大 ， 后 相应 地 更 新 路 由 表 
看 到 这 个 后 其 他 路 由 器 会 
找到 一 个 更 短 的 路 由 


图 12-23 ” 带 毒 型 反 转 的 水 平分 割 路 由 


在 大 型 网 络 中 ， 跳 数 可 能 是 一 个 误导 性 的 指标 ， 特 别 是 当 网 络 中 包含 了 多 种 设备 和 线路 速 
度 时 。 例 如 ， 假 设 一 个 数据 包 到 某 处 有 两 条 路 可 供 选 择 。 一 条 路 在 100Mbit/s 局 域 网 中 经 过 6 
个 路 由 器 ， 而 另 一 条 路 在 64Kbit/s 租用 线路 中 经 过 两 个 路 由 器 。 虽 然 100Mbit/s 局 域 网 可 以 提 
供 超过 10 倍 的 吞吐 量 ， 但 是 跳 数 指标 将 迫使 其 选择 较 慢 的 租用 线路 。 如 果 不 是 计算 跳 数 ， 而 
是 测量 实际 的 线路 延迟 时 间 ， 那 么 就 可 以 避免 这 样 的 异常 情况 。 这 就 是 后 面 将 要 介绍 的 链 路 状 
态 路 由 的 想法 。 

与 距离 向 量 路 由 一 样 ， 链 路 状态 路 由 也 是 一 种 自 管理 的 路 由 系统 。 每 个 路 由 器 通过 周期 性 
地 发 送 hello 包 发 现 自身 和 相 邻 路 由 器 之 间 的 线路 速度 。 在 发 送 数据 包 后 ， 路 由 器 启动 一 个 定 
时 器 。 随 后 接收 到 数据 包 的 每 个 路 由 器 会 立即 发 送 一 个 答复 。 发 送 数据 包 的 路 由 器 一 旦 得 到 了 
答复 ， 它 就 停止 定时 器 ， 并 将 结果 除 以 2， 得 到 连接 到 这 个 数据 包 的 路 由 器 的 单程 时 间 估 计 。 
一 且 接 收 到 所 有 的 回复 ， 路 由 器 就 用 这 些 时 间 形 成 一 个 链 路 状态 值 表 。 然 后 广播 这 个 表 到 除了 
邻居 外 的 所 有 其 他 路 由 器 。 然 后 不 相 邻 的 路 由 器 使 用 这 些 信息 来 更 新 所 有 路 由 ， 包 括 发 送 路 由 
器 。 最 终 ， 路 由 域内 的 所 有 路 由 器 都 会 有 相同 的 路 由 表 。 简 单 地 说 ， 在 收敛 发 生 之 后 ， 在 每 个 
路 由 器 的 路 由 表 中 都 存在 一 个 网 络 快照 。 然 后 ， 路 由 器 使 用 这 个 快照 计算 路 由 表 中 到 达 每 个 目 
的 地 的 最 佳 路 径 。 

在 计算 最 优 路 由 时 ， 每 个 路 由 器 都 将 自己 看 作 树 的 根 节点 ， 每 个 目的 地 都 是 树 的 内 部 叶子 
节点 。 使 用 这 个 概念 ， 路 由 器 对 每 个 目的 地 使 用 Dijkstra 算法 “来 计算 一 条 最 优 路 径 。 一 旦 找 
到 ， 路 由 器 只 存储 沿 着 路 径 的 下 一 跳 ， 它 不 存储 整个 路 径 。 下 一 个 (下 游 ) 路 由 器 应 该 也 已 经 
计算 出 了 相同 的 最 佳 路 径 ， 或 者 当 一 个 数据 包 到 达 时 找到 的 一 条 更 好 的 路 径 ， 所 以 它 将 使 用 最 
佳 路 径 中 的 下 一 条 线路 ， 这 条 最 佳 路 径 是 由 它 的 上 游 路 由 器 计算 得 到 的 。 在 图 12-22a 中 ， 当 





加 对 于 Dijkstra 算法 的 解释 ， 参 见 附 录 。 
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路 由 器 1 采用 了 Dijkstra 算法 后 ， 它 看 到 的 网 络 如 图 12-24 所 示 。 





图 12-24 路 由 器 1 使 用 链 路 状态 路 由 和 Dijkstra 算法 看 到 的 图 12-22a 中 的 网 络 


显然 ， 路 由 器 只 能 保留 有限 的 信息 。 一 旦 网 络 性 能 开始 下 降 ( 通 常 这 种 情况 的 发 生 是 有 原因 
的 ， 除 了 路 由 表 饱 和 外 ) ， 必 须 将 这 个 网 络 分 成 子 网 或 网 段 。 在 非常 大 的 网 络 中 ， 采 用 交换 和 路 
由 技术 相 结合 的 层次 结构 拓扑 可 帮助 保持 系统 的 可 管理 性 。 最 好 的 网 络 设计 者 知道 在 系统 设计 中 
何 时 使 用 何 种 技术 。 最 终 目 标 是 最 大 限度 地 提高 吞吐 量 ， 同 时 保持 网 络 的 可 管理 性 和 健壮 性 。 


什么 是 防火 墙 ? 


几乎 在 政府 、 工 业界 和 学 术 界 工作 的 每 个 人 在 日 常 工作 中 都 会 使 用 因特网 。 然 而 ， 在 因 特 
网 上 有 形形色色 的 人 ， 包 括 抢劫 或 破坏 公司 计算 资源 的 人 。 那 么 ， 如 何 让 一 个 网 络 足 够 开放 ， 
让 人 们 做 好 自己 的 工作 ， 但 又 足够 安全 ， 以 保护 企业 的 资产 呢 ? 解决 这 个 问题 的 首选 方案 是 在 
内 部 网 络 和 因特网 之 间 设 置 防火 墙 。 

防火 墙 是 通过 对 相 邻 建筑 物 之 间 的 高 砖 墙 进行 类 比 而 得 名 的 。 如 果 其 中 一 栋 建筑 物 发 生火 
灾 ， 那 么 相 邻 的 建筑 物 就 要 有 防止 卷 入 火灾 的 保护 。 所 以 它 是 一 个 网 络 防火 墙 : 内 部 用 户 与 可 
能 会 损害 内 部 网 络 结构 的 外 部 用 户 分 隔 开 。 

防火 墙 有 很 多 种 。 最 流行 的 两 种 类 型 是 基于 路 由 器 的 防火 墙 和 基于 主机 的 防火 墙 或 代理 服 
务 器 防火 墙 。 两 种 类 型 的 防火 墙 都 使 用 名 为 策略 的 规则 库 编程 。 防 火 墙 策略 定义 了 哪些 网 络 地 
址 可 以 访问 哪些 服务 。 文 件 传 输 策 略 是 一 个 很 好 的 例子 。 可 以 设置 防火 墙 允许 内 部 用 户 (在 网 
络 的 保护 侧 ) 从 因特网 上 下 载 文件 。 保 护 网 络 之 外 的 用 户 将 禁止 从 内 部 网 络 上 下 载 文件 。 假 设 
网 络 内 部 的 数据 可 能 包含 敏感 私人 的 信息 。 任 何 防火 墙 都 可 以 设置 禁用 地 址 列表 。( 这 有 时 称 
为 黑 名 单 。) 列 入 黑 名 单 的 地 址 通常 包括 传播 不 良 素材 的 团体 网 站 

这 两 种 类 型 的 防火 墙 也 会 区 分 流入 流量 和 流出 流量 。 这 可 
以 防止 试图 欺骗 防火 墙 的 地 址 欺骗 ， 让 防火 墙 以 为 用 户 在 网 络 
内 ， 但 实际 上 用 户 在 网 络 之 外 。 如 果 防 火 墙 被 伪造 地 址 所 欺骗， 
那么 外 部 用 户 就 可 以 在 内 部 网 络 上 自由 运行 。 

基于 路 由 器 的 防火 墙 和 代理 服务 器 都 具有 加 密 网 络 流量 的 
能 力 。 加 密 是 使 用 一 个 算法 和 一 个 键 值 来 对 消息 进行 加 密 的 过 
程 ， 这 样 唯一 能 读 取 消息 的 设备 就 是 具有 相应 密 钥 的 设备 。 键 
值 周 期 性 地 变化 ， 通 常 每 天 改变 。 当 防火 墙 被 设置 为 密 钥 交换 
例 程 时 ， 键 值 周期 变化 的 过 程 是 自动 进行 的 。 路 由 器 倾向 于 使 
用 比较 简单 的 加 密 算 法 ， 通 常 使 用 简单 移 位 算法 和 逻辑 “与 算 
法 ， 即 消息 与 键 值 进行 逻辑 与 运算 。( 一 个 这 样 的 算法 是 美国 
联邦 数据 加 密 标准 (DES)。 为 了 更 安全 ,消息 有 时 加 密 三 次 ， 
这 叫 作 三 重 DES。) 
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如 你 所 料 ， 代 理 服 务 器 比 基 于 路 由 器 的 防火 墙 慢 、 也 容易 失败 ， 但 它们 也 比 基 于 路 由 器 的 
防火 墙 具有 更 多 的 功能 。 首 先是 它们 在 内 部 网 络 中 充当 用 户 代理 的 功能 (因此 得 名 代理 服务 
器 ) 。 这 些 系统 通常 配 有 两 个 网 卡 ， 即 它们 是 双 宿主 主机 。 一 个 网 卡 连 接 到 内 网 ， 另 一 个 网 卡 
连接 到 外 网 。 使 用 这 种 配置 时 ， 对 外 部 用 户 服 务 器 可 以 完全 屏蔽 内 网 的 特征 。 外 部 用 户 可 以 看 
到 的 是 连接 到 外 部 的 网 络 接口 地 址 。 

基于 服务 器 的 防火 墙 还 可 以 维护 各 种 网 络 日 志 。 通 过 这 些 日 志 ， 安 全 管理 员 可 以 检测 外 部 
恶意 用 户 的 大 多 数 入 侵 进 攻 。 在 某 些 情况 下 ， 日 志 可 以 提供 进攻 来 源 的 信息 。 


12.7 因特网 的 脆弱 性 

在 短 短 的 35 年 中 ,冷战 的 秘密 DARPA 网 已 经 变 成 民用 和 工业 的 关键 资源 。 虽 然 因 特 网 是 
我 们 进行 信息 和 金融 交易 的 主要 渠道 ， 但 是 监测 控制 和 数据 采集 (SCADA) 网 络 的 结构 却 不 那 
么 明显 。SCADA 系统 在 物理 基础 设施 中 起 着 至 关 重 要 的 作用 ,包括 发 电 设备 、 运 输 网 、 污 水 
处 理 系统 和 石油 与 天 然 气管 道 ， 等 等 。 

由 于 内 在 的 通信 需求 ，SCADA 系统 是 通过 因特网 进行 连接 的 第 一 批 控制 系统 。 目 前 该 系 
统 中 很 少 涉及 关键 设备 ， 但 是 有 大 量 控制 集合 和 名 为 物 联网 (loT ) 或 机 器 对 机 器 通信 ( M2M ) 的 
传 感 节点 。 物 联网 的 跨度 涵盖 了 从 最 小 的 RFID 芯片 到 家 用 电器 再 到 安全 系统 的 一 切 。 人 们 可 
以 很 容易 地 预见 这 样 的 世界 , 将 来 每 个 对 象 都 会 被 标记 ， 并 能 够 通过 网 络 报告 它 的 位 置 。 智 能 
节点 甚至 可 以 与 其 他 节点 协作 进行 决策 。 思 科 系 统 公司 估计 ， 在 2020 年 使 用 的 M2M 设备 可 能 
多 达 500 亿 台 。 如 果 没 有 因特网 ， 那 么 这 些 设备 (包括 大 部 分 重要 的 SCADA 基础 设施 ) 可 能 都 
会 变 得 毫 无 用 处 。 

正如 本 章 前 面 所 述 ， 因 特 网 是 以 生存 性 为 目的 设计 的 。 如 果 一 个 路 由 器 失效 ， 那 么 可 以 很 
容易 地 使 用 另 一 个 路 由 器 。 事 实 上 ， 这 种 健壮 性 在 2012 年 10 月 飓风 桑 迪 袭击 美国 中 部 大 西洋 
地 区 时 表现 得 非常 明显 。 因 特 网 监控 公司 Renesys 估计 ,在 2012 年 10 月 29 日 至 10 月 30 日 间 ， 
尽管 数量 可 观 的 电缆 和 其 他 设备 被 水 淹没 或 断 电 ， 但 是 在 曼哈顿 地 区 仅 有 5% 的 网 络 中 断 。 此 
外 ， 这 个 问题 的 大 部 分 都 限制 在 曼哈顿 ， 这 个 严重 的 事件 并 没有 扩大 到 整个 地 区 。 

实际 上 ， 如 果 美 国 东北 部 的 因特网 基础 设施 能 够 在 超级 风暴 桑 迪 的 袭击 下 免 遭 破坏 ， 那 么 
可 能 会 让 人 相信 因特网 可 以 在 任何 情况 下 生存 。 然 而 ， 一 些 因 特 网 观察 家 变 得 越 来 越 担 心 ， 网 
络 战争 的 可 能 性 是 人 们 听 到 的 最 强 的 警报 声 ， 特 别 是 针对 SCADA 系统 的 网 络 战 。 一 次 有 效 的 
SCADA 攻击 可 以 导致 国家 电力 系统 和 交通 网 络 的 大 面积 瘫 病 。 即 使 是 少量 的 针对 少数 战略 骨 
干 网 络 路 由 器 的 攻击 ， 也 会 造成 灾难 性 的 连锁 实效 。 在 这 种 情况 下 ， 失 效 的 路 由 器 压 震 了 主干 
网 上 的 其 他 路 由 器 ， 也 造成 了 它们 的 故障 。 

第 二 个 问题 是 物 联网 带 来 的 带宽 需求 越 来 越 大 。 这 些 设 备 将 会 把 什么 类 型 的 流量 放 到 网 
上 ， 这 种 问题 是 不 可 能 描述 出 来 的 。 会 不 会 是 包含 数 十 亿 个 短 UDP 类 型 的 突 发 信息 ? 会 不 会 
是 时 间 敏 感 的 数据 流 ? 到 目前 为 止 ， 简 单 地 给 网 络 增加 更 多 的 电缆 和 路 由 器 已 经 满足 了 网 络 容 
量 的 需求 。 但 是 随 着 更 多 的 设备 添加 到 网 络 中 ， 路 由 表 会 变 得 越 来 越 大 ， 选 择 路 由 和 转发 包 的 
时 间 就 会 越 来 越 长 。 当 不 能 及 时 做 出 决策 时 ， 就 会 引起 丢 包 和 需要 重 传 ， 这 会 导致 网 络 出 现 更 
多 的 流量 。 在 最 糟糕 的 情况 下 ， 这 种 情况 可 能 会 导致 拥塞 崩溃 出 现 ， 这 时 大 量 的 路 由 器 离线 ， 
因为 它们 不 能 再 处 理 它 们 的 传人 流量 ， 甚 至 拒绝 我 们 在 拥塞 控制 方面 做 的 最 大 努力 。 

意识 到 物 联网 可 能 会 发 送 超过 网 络 限度 的 数据 包 ， 科 学 家 已 经 提出 了 更 加 智能 或 具有 认 知 
的 数据 包 路 由 方法 。 这 个 想法 利用 了 网 络 中 终端 节点 的 智能 。 也 就 是 说 ， 终 端 节点 可 以 直接 进 
行 点 对 点 交换 ， 而 不 需要 主机 。 举 个 简单 的 例子 ， 考 虑 一 下 通过 WiFi 将 数码 照片 从 智能 手机 
传送 到 平板 电脑 的 过 程 。 在 许多 情况 下 ， 数 码 照片 从 手机 到 中 心路 由 器 ， 然 后 反 向 通过 因特网 
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到 达 平 板 电 脑 。 尽 管 这 些 设备 彼此 之 间 相 距 几 英寸 , 但 是 数据 包 却 可 能 旅行 了 数 百 英里 。 事 实 
上 , 一 天 中 会 有 500 亿 次 这 样 的 传输 ， 毫 无 疑问 拥塞 崩溃 是 个 真实 的 问题 。 因 特 网 不 断 地 努力 
工作 ,在 许多 威胁 面前 保持 领先 。 但 这 种 努力 的 工作 ， 最 终 导致 筋疲力尽 。 让 因特网 更 聪明 地 
工作 的 时 候 到 了 。 和 否则 ， 我 们 可 能 会 被 迫 回忆 如 何 度 过 没有 因特网 的 生活 。 


本 章 小 结 

本 章 概 述 了 用 于 构建 数据 通信 系统 的 网 络 组 件 和 协议 。 每 个 网 络 组 件 及 每 个 网 络 进程 ， 执 行 在 分 层 
协议 栈 中 处 于 某 个 层次 的 一 项 任务 。 网 络 工程 师 使 用 0SI 参考 模型 的 层次 描述 所 有 网 络 组 件 的 角色 和 职 
责 。 当 一 台 计 算 机 与 另 一 台 计算 机 进行 通信 时 ， 协 议 栈 的 每 一 层 与 运行 在 远程 系统 上 的 相应 层 进行 对 话 。 
协议 层 与 它们 相 邻 层 的 接口 使 用 服务 访问 点 。 

大 多 数 因特网 应 用 程序 依赖 于 TCP/IP， 而 迄今 为 止 应 用 最 广泛 的 数据 通信 协议 。 虽 然 通常 称 为 
TCP/IP, 但 是 实际 上 这 是 两 个 协议 。TCP 提供 了 一 种 在 不 可 靠 耻 上 建立 可 靠 通信 流 的 方法 。 第 4 版 全 组 
件 受 到 32 位 地 址 字段 的 限制 。 第 6 版 全 将 解决 这 个 问题 ， 因 为 它 的 地 址 字段 是 128 位 宽 。 对 于 较 大 的 地 
址 段 ， 计算 路 由 可 能 是 一 项 艰巨 的 任务 。 为 此 ，IETF 已 经 设计 了 一 个 分 层 地 址 解决 方案 ， 可 聚合 全 局 单 
播 地 址 格式 使 得 数据 包 路 由 计算 更 容易 并 且 更 快 。 

我 们 描述 了 对 于 绝 大 多 数 数据 通信 和 网络 常见 的 一 些 组 件 。 在 这 些 组 件 中 最 重要 的 是 物理 介质 和 路 由 
器 。 选 择 物 理 介质 必须 考虑 预期 负载 和 所 覆盖 的 距离 。 必 要 时 ， 可 以 使 用 中 继 器 扩展 物理 介质 。 路 由 器 
是 监视 网 络 状态 的 复杂 设备 。 通 过 配置 可 以 允许 路 由 器 为 网 络 流量 选择 接近 最 优 的 路 径 。 

随 着 因特网 作为 商用 工具 的 不 断 增长 ， 路 由 问题 也 将 随 之 增长 。 若 要 解决 这 些 问 题 ， 可 能 最 终 要 重 
新 思考 形成 因特网 基础 的 架构 和 一 些 假设 。 


扩展 阅读 


并 不 缺乏 计算 机 网 络 主题 的 文献 。 现 在 面临 的 挑战 是 如 何 找到 好 的 计算 机 网 络 的 文献 。Tanenbaum 
(2010) 、Stallings(2013 ) 、Kurose 和 Ross(2012 ) 等 人 编写 的 教材 是 最 好 的 几 本 数据 通信 教材 。Tanenbaum 
的 书 按照 OSI 协议 栈 层 次 组 织 ， 对 大 多 数 数据 通信 和 网 络 的 重要 概念 的 介绍 都 容易 读 懂 。Kurose 和 Ross 
的 书 以 非常 详细 并 且 使 用 了 读者 可 以 理解 的 方式 讨论 了 本 章 中 介绍 的 大 部 分 主题 。Stallings 的 书 和 Tanen- 
baum 的 书 有 很 多 相同 的 材料 ， 但 是 Stallings 的 书 更 严谨 更 详细 。Sherman(1990) 的 书 也 是 一 本 写 得 很 好 
的 (但 是 内 容 有 些 陈旧 ) 数 据 通信 入 门 书籍 。Sherman 提供 的 历史 视角 妙 极 了 。 

有 关 因 特 网 标准 (FRC ) 信息 的 权威 来 源 是 因特网 工程 任务 组 网 站 ( www. ietf. org) 。 在 本 章 中 出 现 的 与 
RFC 相关 的 材料 是 : 

e RFC 791”Jnternet Protocol Version 4(IPv4)” 

RFC 793” Transmission Control Protocol( TCP) ” 

RFC 1180“ A TCP/IP Tutorial” 

RFC 1887” An Architecture for IPv6 Unicast Address Allocation” 
RFC 2460”Internet Protocol ，Version 6( IPv6 ) Specification ” 
RFC 2026”The Internet Standards Process” 

e RFC 1925“The Fundamental Truths of Networking” 

由 Rodriguez 、GCetrell 、Karas 、Peschke(2001 ) 编写 的 IBM TCP/IP 教程 红皮书 是 正 TF 中 最 廉价 可 读 的 
外 部 资源 之 一 。 与 IETF 网 站 不 同 ， 它 还 讨论 了 使 用 特定 供应 商 的 产品 实现 TCP/IP 的 方法 (没有 天 花 乱 险 
的 广告 宣传 ) 。Minoli 和 Schmidt(1999 ) 的 书 在 讨论 因特网 基础 设施 时 特别 关注 服务 质量 问题 。 

Clark( 1997 ) 对 英国 的 电话 通信 进行 了 详细 而 全 面 的 叙述 。 它 涉及 公共 电话 网 络 的 重要 方面 ， 包 括 可 
以 承载 的 数据 流量 能 力 。Burd(1997 ) ISDN 和 de Prycker( 1996) ATM 的 书 都 对 各 自主 题 做 了 明确 的 叙述 。 
IBM(1995 ) ATM 红皮书 ， 虽 然 不 如 de Prycker 的 书 严谨 ， 但 是 它 对 ATM 的 显著 特点 进行 了 非常 好 和 客观 
详细 的 介绍 。 

更 多 的 与 因特网 骨干 路 由 器 不 稳定 问题 有 关 的 信息 ， 参 见 Labovitz、Malan 和 Jahanian( 1998 ，1999 ) 
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撰写 的 论文 。 密 西根 大 学 维护 着 一 个 致力 于 因特网 性 能 问题 的 网 站 ， 网 址 是 www. merit edu/ipma/。 

跟 上 最 新 数据 网 络 技术 发 展 的 唯一 途径 是 不 断 阅读 专业 和 商业 期 刊 。 最 新 的 信息 可 以 在 ACM 和 
IEEE 的 出 版 物 中 找到 。 其 中 最 突出 的 是 正 EE/ACM 网 络 期 刊 和 IEEE 网 络 杂 志 。 商 贸 期 刊 是 另 一 个 不 错 
的 信息 来 源 ， 特 别 是 可 以 了 解 各 种 供应 商 如 何 实 施 最 新 的 网 络 技术 。 由 CMP 出 版 的 两 本 这 样 的 杂志 
《网 络 计算 》( www. networkcomputing. com ) 和 《网 络 杂 志 》( www. networkmagazine. com ) 。《 网 络 世 界 》 是 由 
CW 通信 (CW Communications ) 出 版 的 一 本 周刊 杂志 ,不 仅 有 精良 的 纸 质 版 ， 而 且 还 有 相关 的 网 站 
(www. nwfusion. com ) 提供 大 量 资 料 和 资源 。 

许多 设备 供应 商会 在 他 们 的 网 站 上 发 布 优秀 的 、 低 宣传 性 的 教程 信息 。 这 些 供应 商 包括 IBM 和 思科 
系统 等 。 当 然 ， 当 你 探索 与 本 章 主题 相关 的 具体 技术 时 ， 你 会 发 现 其 他 非常 好 的 商业 网 站 。 当 涉及 数据 
通信 时 ， 似 乎 永远 也 学 不 够 (无 论 多 么 努力 ) 。 
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复习 题 

. 轮 询 网 络 的 组 织 结 构 与 互联 网 的 组 织 结构 有 什么 不 同 ? 

. 什么 协议 设备 是 DARPA 网 鲁 棒 性 的 关键 ? 

. 谁 为 因特网 制定 了 标准 ? 

.因特网 标准 的 正式 名 称 是 什么 ? 

.1SO/OSI 参考 模型 的 哪 一 层 负 责 协商 帧 的 大 小 和 传输 速度 ? 

.如 果 通 信 会 话 要 使 用 加 密 或 压缩 ， 那 么 ISO/OSI 参考 模型 的 哪 一 层 将 会 执行 这 个 服务 ? 
. 根据 12. 5. 1 节 描 述 的 IPv4 格式 ， 人 P 协议 号 占用 的 是 哪 几 位 ? 这 个 字段 的 作用 是 什么 ? 
.为 什么 某 些 类 型 的 卫 地 址 会 变 得 稀缺 ? 

.解释 TCP 的 一 般 用 途 。 

10,IPv6 如 何 对 IPv4 进行 了 改进 ? 

11. 有 线 传输 介质 和 无 线 传 输 介质 之 间 的 不 同 是 什么 ?” 举 一 些 各 自 的 例子 。 

12. 什么 决定 了 传输 介质 的 质量 ? 使 用 什么 度量 标准 ? 

13. 衰减 的 主要 原因 是 什么 ? 什么 有 助 于 减少 衰减 ? 
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14. 一 条 线路 的 波 特 率 和 位 率 之 间 有 什么 不 同 ? 


5. 光缆 的 3 种 类 型 分 别 是 什么 ? 能 够 传输 信号 最 快 的 是 哪 一 种 ? 
6. 哪里 可 以 找到 MAC 地 址 ? MAC 地 址 中 有 多 少 字 节 ? 


17. 简要 描述 中 继 器 、 集 线 器 、 交 换 机 和 路 由 器 之 间 的 区 别 。 

18. 网 桥 和 网 关 之 间 的 不 同 是 什么 ? 哪 一 个 更 快 ? 为 什么 ? 

19. 什么 时 候 使 用 静态 路 由 不 是 一 个 非常 好 的 想法 ? 

20. 给 出 两 种 重要 的 方法 ， 使 在 这 两 种 方法 中 链 路 状态 路 由 不 同 于 距离 向 量 路 由 。 


1. 距离 向 量 路 由 带 来 的 3 个 主要 问题 是 什么 ? 
。 防火墙 以 什么 方式 提供 了 安全 性 ? 


22 
23. 什么 是 SCADA 系统 ? 
24 


. 因特网 受到 了 什么 方式 的 威胁 ? 


习题 


1 
2 
3 
4 


4 5. 


. 早期 商用 计算 机 网 络 的 流量 与 早期 科学 学 术 网 络 的 流量 有 什么 不 同 ? 这 两 种 系统 今天 有 区 别 吗 ? 

;为 什么 ISO/OSI 协议 栈 被 称 为 参考 模型 ? 你 认为 情况 会 总 是 这 样 吗 ? 

网 络 层 协议 与 传输 层 协议 有 什么 不 同 ? 

. 因特网 协议 标准 是 通过 世界 各 地 成 千 上 万 人 的 努力 而 设计 出 来 的 ， 不 管 他 们 在 数据 通信 方面 有 什么 特 

殊 的 背景 。 另 一 方面 ， 专 有 协议 是 由 一 小 部 分 人 创建 的 ， 他 们 都 是 直接 或 间接 为 同一 个 雇主 工作 。 

a) 你 认为 每 种 方法 都 有 哪些 优点 和 缺点 ? 哪 种 方法 能 生产 出 更 好 的 产品 ? 哪 种 方法 能 更 快 地 生产 出 
品 ? 

b) 你 为 什么 认为 IETF 方法 与 专 有 方法 相 比 已 经 获得 了 支配 地 位 ? 

在 对 TCP 报头 窗口 字段 的 描述 中 ， 我 们 说 : 

请 注意 ， 如 果 接 收 器 的 应 用 程序 运行 得 非常 慢 ， 比 如 说 它 每 次 从 缓冲 区 取 1 或 2 个 字 节 数据 ， 则 在 接 

收 器 上 运行 的 TCP 进程 应 该 等 到 应 用 程序 缓冲 区 空 到 足以 可 以 发 送 另 一 个 报 文 段 为 止 。 

发 送 另 一 个 报 文 段 的 “理由 ”是 什么 ? 


6. 0SI 协议 栈 除了 应 用 层 之 外 还 包含 会 话 层 和 表示 层 。TCP/IP 应 用 程序 (如 Telnet 和 FTP) ， 没 有 定义 这 


些 单独 的 层 。 你 认为 应 该 这 样 分 开 这 些 层 吗 ? 给 出 将 0SI 方法 并 人 TCP/IP 中 的 一 些 优点 和 缺点 。 


7. 为 什么 TCP 报 文 段 的 长 度 限 制 在 65 515 字 节 ? (提示 : 查看 TCP 报 文 段 格式 的 数据 偏 移 字段 的 定义 。) 
8. 为 什么 IETF 使 用 单词 octet 代替 byte? 你 认为 这 种 做 法 应 该 继续 下 去 吗 ? 
* 9. 下 列 IP 地 址 属于 哪 类 网 络 ? 


1 


.1 


1 


+ a) 180. 265. 14.3 

4 b) 218. 193. 149. 222 

4 c) 92. 146. 292.7 

0. 下 列 卫 地 址 属于 哪 类 网 络 ? 
a) 223. 52. 176. 62 
by 127. 255. 255.2 
c) 191. 57. 229. 163 

1. 运行 TCP/IP 的 工作 站 需要 将 文件 传输 到 主机 。 该 文件 包含 1024 个 字 节 。 如 果 有 效 载 荷 大 小 为 128 字 
节 ， 并 且 这 两 个 系统 都 运行 Pv4 ， 那 么 将 发 送 多 少 字 节 (包括 所 有 的 TCP/IP 开销 )? (同时 假设 三 次 
握手 和 窗口 大 小 协商 已 经 完成 ， 在 传输 过 程 中 不 会 出 现 错误 。) 

* a) 协议 开销 是 多 少 ( 以 百分比 表示 )? 

* b) 执行 相同 的 计算 ,假设 两 个 客户 端 都 使 用 IPv6。 

2. 运行 TCP/IP 的 工作 站 需要 将 文件 传输 到 主机 。 该 文件 包含 2048 个 字 节 。 如 果 有 效 载荷 大 小 为 512 字 
节 ， 并 且 这 两 个 系统 都 运行 Pv4， 那 么 将 发 送 多 少 字 节 ( 包 括 所 有 的 TCP/IP 开销 )? (同时 假设 三 次 
握手 和 窗口 大 小 协商 已 经 完成 ， 在 传输 过 程 中 不 会 出 现 错误 。) 
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ba 


14. 


Is; 
16. 
I 


18. 


* 19. 


ba 


20. 


21. 


22. 





a) 协议 开销 是 多 少 ( 以 百分比 表示 )? 
b) 执行 相同 的 计算 ,假设 两 个 客户 端 都 使 用 IPv6。 


. 两 个 运行 TCP/IP 的 工作 站 要 传送 一 个 文件 。 这 个 文件 的 长 度 是 100KB， 有 效 负载 大 小 是 100 字 节 ， 


协商 窗口 大 小 是 300 字 节 。 发 送 方 接收 到 一 个 来 自 接收 方 的 ACK 1500。 

a) 下 一 次 应 该 发 送 哪些 字 节 ? 

b) 如 果 接 收 方 没有 发 送 ACK， 那 么 可 以 发 送 的 最 后 一 个 字 节 号 是 什么 ? 

两 个 运行 TCP/IP 的 工作 站 要 传送 一 个 文件 。 这 个 文件 的 长 度 是 10KB， 负载 大 小 是 100 字 节 ， 协 商 窗 

口 大 小 是 2000 字 节 。 发 送 方 接收 到 一 个 来 自 接收 方 的 ACK 900。 

a) 下 一 次 应 该 发 送 多 少 字 节 ? 

b) 如 果 接 收 方 没有 发 送 ACK， 那 么 可 以 发 送 的 最 后 一 个 字 节 号 是 什么 ? 

如 果 TCP 不 允许 发 送 方 和 接收 方 协商 超时 窗口 那么 它们 自己 会 出 现 什么 问题 ? 

IP 是 一 种 无 连接 协议 ， 而 TCP 是 面向 连接 的 。 这 两 个 协议 如 何在 同一 协议 栈 中 共存 ? 

在 12.6.1 节 指出 当 采 用 4B/5B 编码 时 ， 一 种 有 100Mbit/s 位 率 的 传输 介质 需要 125MHz 的 信号 承载 能 

a 

a) 如 果 使 用 曼彻斯特 编码 ， 那 么 将 需要 什么 样 的 信号 承载 能 力 ? 

b) 如 果 使 用 修改 频率 调制 ( MFM) 编 码 ， 假 设 一 个 发 生 0 和 1 的 概率 是 同等 的 ， 那么 将 需要 什么 样 的 
信号 承载 能 力 ? 
(在 2.A 节 有 曼彻斯特 编码 和 MFM 编码 的 解释 。) 

a) 一 类 特定 网 线 的 信号 功率 是 8733. 16dB， 在 特定 信号 强度 为 100MHz 时 噪声 等 级 是 41. 8dB。 求 这 
种 导体 的 信 噪 比 。 

b) 假设 网 线 部 分 的 噪声 等 级 是 9. 5dB 并 且 当 传输 200MHz 的 信号 时 噪声 等 级 是 36. 9dB。 求 信号 强度 
是 多 少 ? 

a) 一 类 特定 网 线 的 信号 功率 是 2898dB ， 在 特定 信号 强度 为 100MHz 时 噪声 等 级 是 40dB。 求 这 种 导体 
的 信 噪 比 。 

b) 假设 网 线 部 分 的 噪声 等 级 是 0.32dB 并 且 当 传输 200MHz 的 信号 时 噪声 等 级 是 3534B。 求 信号 强度 
是 多 少 ? 

一 个 物理 层 协议 数据 单元 是 多 大 ? 这 个 问题 的 答案 决定 了 许多 网 络 体系 结构 同时 传输 的 数量 。 如 果 
信和 号 以 2 x 10 mvs 的 速度 通过 铜 线 来 传播 ， 那 么 在 载波 为 10Mbivs 时 ， 每 位 脉冲 长 度 由 下 式 给 定 : 
传播 速度 /总 线 速度 = (2 x 10sm/s)/(10 x 10°bit/s) = 20m/bit 

如 果 一 个 数据 帧 是 512 位 长 ， 那 么 整个 帧 占用 : 
一 位 长 度 x 帧 大 小 = 20 x 512 = 10 240(m) 
a) 如 果 网 络 速度 为 100Mbit/s， 那 么 一 个 1024 位 的 数据 包 是 多 大 ? 
b) 如 果 网 络 速 度 提高 到 155Mbit/s， 那 么 一 个 1024 位 的 数据 包 是 多 大 ? 
c) 在 100Mbit/s 下 ， 一 个 这 样 的 帧 通过 网 络 中 的 一 个 特定 节点 需要 花费 多 长 时 间 ? 
它 看 起 来 就 像 图 12-14 中 4B/5B 的 位 单元 那么 小 。 这 样 的 位 单元 在 125MHz 的 线路 上 需要 多 长 的 传输 
时 间 ? (使 用 前 面 问题 中 的 常量 和 公式 。) 
参考 图 12-21 ， 假 设 路 由 器 4 可 从 路 由 器 1 和 路 由 器 3 的 路 由 表 中 导出 其 路 由 表 。 使 用 与 其 他 3 个 路 
由 器 的 路 由 表 相 同 的 格式 ， 完 成 路 由 器 4 的 路 由 表 。 
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13.1 引言 


世界 对 数据 的 渴望 和 对 信息 的 热情 似乎 没有 上 限 。 如 果 有 可 能 的 话 应 该 以 某 种 方式 捕捉 活 
动 的 数字 本 质 ， 但 似乎 我 们 完全 无 法 这 样 做 。 就 好 像 我 们 无 法 在 档案 中 锁定 一 个 十 年 后 会 是 唯 
一 重要 的 字 节 一 样 。 

可 以 考虑 把 去 商场 买 东西 作为 一 个 例子 。 如 果 你 开车 到 那里 ， 那 么 你 的 汽车 可 能 会 利用 内 
部 计算 机 系统 记录 状态 信息 ， 而 它 的 全 球 定位 系统 会 不 断 地 把 你 的 位 置 发 送 给 卫星 。 一 旦 进入 
商场 ， 你 可 能 会 被 拍摄 好 几 次 ,并 且 将 其 记录 在 一 个 数字 安全 系统 中 。 你 放 在 购物 禾 中 的 商品 
可 能 包含 腻 入 式 射 频 识 别 ( RFID ) 标 签 。 当 你 从 一 个 通道 走 到 另 一 个 通道 时 ， 整 个 商场 的 传 感 
器 会 不 断 地 记录 包含 标签 包装 袋 的 位 置 。 当 你 结账 时 ， 购 买 的 每 件 商品 都 会 记录 在 计算 机 中 ， 
从 而 更 新 财务 记录 和 库存 记录 。 当 你 使 用 “会 员 卡 ”之 类 的 卡 时 ， 你 的 购买 就 与 个 人 信息 联 
系 在 一 起 了 。 用 信用 卡 或 借 记 卡 支付 你 的 购物 费用 时 ， 在 金融 处 理 链 的 各 种 计算 机 中 就 会 产生 
更 多 的 事务 。 几 天 后 ， 一 些 数据 可 以 通过 数据 仓库 、 数 据 挖掘 或 决策 支持 系统 进行 提取 ， 从 而 
在 数据 库 表 中 创建 更 多 的 行 。 因 此 , 在 21 世纪 ,购物 这 种 不 起 眼 的 事情 可 能 会 产生 几 兆 字 节 
的 可 能 要 保存 数 年 的 数据 。 人 类 是 否 能 够 理解 这 一 切 一 一 如 果 他 们 这 样 做 了 会 怎么 样 一 一 是 我 
们 不 想 在 这 里 讨论 的 问题 。 我 们 将 描述 帮助 计算 机 系统 处 理 这 种 所 谓 的 信息 爆炸 的 硬件 结构 。 

从 历史 上 看 ,企业 中 的 电子 记录 存储 在 完全 相同 的 并 且 集 中 的 磁盘 和 磁带 存储 系统 中 ， 这 
些 系 统 直 接连 接 到 大 型 主机 系统 上 。 所 有 磁盘 驱动 器 、 磁 带 驱 动 器 和 主 CPU 等 都 在 一 个 操作 
系统 (或 者 是 相同 操作 系统 的 多 个 镜像 ) 的 控制 下 。 在 过 去 的 20 年 中 ， 集 中 式 配 置 已 经 由 各 种 
各 样 的 小 型 服务 器 所 替代 或 补充 ， 这 些 服务 器 提供 专门 服务 ， 包 括 电子 邮件 、 电 子 商务 、 终 端 
用 户 报告 和 一 般 应 用 程序 。 系 统管 理 的 挑战 与 服务 器 平台 和 应 用 程序 的 数量 及 多 样 性 成 比例 增 
长 。 这 些 挑战 中 最 大 的 是 企业 存储 管理 。 

最 近 提 出 的 许多 存储 架构 使 存储 管理 更 容易 。 本 章 的 主要 目的 是 概述 各 种 重要 的 VO 和 存 
储 实现 ， 并 特别 关注 企业 存储 实现 。 你 将 看 到 这 些 实现 如 何 成 为 有 自主 能 力 的 系统 ， 它 们 具有 
与 所 依附 的 主机 系统 不 同 的 体系 结构 模型 。 我 们 首先 讨论 SCSI， 它 是 最 重要 和 最 持久 的 IO 接 
回旋 二 坑 


13.2 SCSI 架构 


小 型 计算 机 系统 接口 (SCSI) 是 由 当时 的 顶级 磁盘 驱动 器 制造 商 、 舒 加 特 协会 (Shugart As- 
sociates) 和 NCR 公司 (以 前 也 是 小 型 计算 机 市 场 上 的 大 企业 ) 在 1981 年 初 发 明 的 。 这 个 接口 最 
初 称 为 舒 加 特 协会 的 标准 接口 (SASI) 。 由 于 这 个 接口 设计 得 很 好 ， 因 此 这 个 接口 在 1986 年 成 
为 ANSI 标准 。ANSI 委员 会 认为 最 好 用 更 一 般 的 术语 来 表示 这 个 新 的 接口 ， 所 以 称 这 个 新 接口 
为 SCSI。 

最 初 标准 的 SCSI 接口 (现在 称 为 SCSI-1) 定 义 了 一 组 命令 、 传 输 协议 和 以 5MB/s 史无前例 
的 速度 把 7 个 磁盘 驱动 器 连接 到 一 个 CPU 所 要 求 的 物理 连接 。 开 创 性 的 想法 是 给 接口 增加 智 
能 性 ， 使 其 或 多 或 少 地 实现 了 自我 管理 。 这 样 就 能 够 让 CPU 专注 于 处 理 计 算 任务 ， 而 不 是 ZO 
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任务 。 在 20 世纪 80 年 代 早期 ， 大 多 数 小 型 计算 机 系统 运行 的 时 钟 频 率 处 于 2 ~8. 44MHz 之 间 ， 
这 使 得 SCSI 总 线 的 吞吐 量 似乎 并 不 耀眼 。 

今天 ，SCSI 已 经 发 展 到 了 第 三 代 ， 称 为 SCSI-3。SCSI-3 是 多 个 接口 标准 ， 它 是 一 个 架构 ， 
正式 的 叫 法 是 SCSI 架构 模型 3( SAM-3) 。 这 种 架构 包括 “经 典 的 ”并 行 SCSI 接口 ， 以 及 三 
个 串 行 接口 和 一 个 混合 接口 。 在 13. 2. 2 节 中 对 SAM 有 更 详细 的 介绍 。 

具有 讽刺 意味 的 是 ，SCSI 不 再 是 小 型 系统 的 主要 接口 。 在 个 人 系统 中 ， 它 已 经 被 简单 、 便 
宜 的 磁盘 所 取代 。 然 而 ， 正 如 本 文 所 述 ，SCSI 用 于 80% 的 企业 级 存储 系统 中 。 由 于 它 在 这 方 
面 的 优势 ， 所 以 很 有 必要 去 了 解 它 是 如 何 工作 的 。 





13.2.1 “经 典 ” 并 行 SCSI 


假如 有 人 对 你 说 ,“ 我 们 刚刚 用 三 个 巨大 的 SCSI 驱动 器 安装 了 一 个 新 的 后 台 服 务 器 ,” 或 
者 “自从 我 升级 到 SCSI 之 后 ,我 的 系统 运行 得 非常 快 。” 说 话 的 人 所 指 的 可 能 是 一 个 SCSI-2 
或 传统 的 并 行 磁 盘 系 统 。 在 20 世纪 80 年 代 ， 说 这 些 话 很 可 能 是 吹牛 ， 因 为 连接 和 配置 第 一 代 
SCSI 设备 非常 困难 。 今 天 ，SCSI 设备 的 传输 率 不 仅 高 出 两 个 数量 级 ， 而 且 它 已 经 具有 了 智能 ， 
因此 几乎 消除 了 早期 SCSI 配置 者 的 烦恼 。 

并 行 SCSI 磁盘 驱动 器 支持 各 种 速度 ， 范 围 从 与 早期 SCSI-2 一 起 向 下 兼容 的 10MB/s 到 最 
新 最 快 SCSI 设备 的 Ultra 实现 的 320MB/s。SCSI 的 众多 优点 之 一 是 单一 SCSI 总 线 不 需要 重新 
接线 或 更 换 驱 动 器 就 能 够 支持 这 个 范围 内 的 设备 速度 。( 但 是 ， 没 有 人 会 给 你 任何 性 能 保证 。) 
一 些 有 代表 性 的 SCSI 功能 如 表 13-1 所 示 。 


表 13-1 各 种 SCSI 功能 的 摘要 





















SCSI 名 称 
SCSI-1 50 
Fast SCSI 50 
Fast 和 Wide \ 2x68 | 40 | 32 
Ultra SCSI 2 x68 或 者 50 与 68 320 16 


SCSI 并 行 体系 i 性 和 健壮 性 应 该 归功 于 SCSI 设备 之 间 可 以 相互 通信 的 事 
实 。SCSI 设备 沿 着 一 个 总 线 以 菊花 链 ( 一 个 驱动 器 的 输入 连接 到 另 一 个 驱动 器 的 输出 ) 方 式 进 
行 连接 。CPU 只 与 世 SCSI 主机 适 配 右 通信 ， 在 需要 时 发 出 VO 命令 。CPU 接着 处 理 自己 的 
业务 ， 而 由 适配器 负责 管理 输入 或 输出 操作 。 一 个 SCSI-2 系统 的 这 种 组 织 。 如 图 13-1 所 示 。 
设备 7 


SCSI 主 机 
适配器 


Cy 
图 13-1 一 种 SCSI-2 的 配置 
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Fast 并 行 SCSI 电缆 有 50 根 导线 ， 其 中 有 8 根 用 于 数据 ，11 根 用 于 各 种 类 型 的 控制 。 其 余 
导线 用 于 电气 接口 。 在 一 个 传输 或 命令 开始 时 ， 设 备 选择 (SEL) 信号 放置 在 数据 总 线 上 。 因 为 
只 有 8 根 数据 线 ， 所 以 最 多 可 以 支持 7 台 设 备 ( 除 了 主机 适配器 ) 。Fast SCSI 和 Wide SCSI 电缆 
有 16 位 数据 总 线 ， 人 允许 其 为 设备 数 的 两 倍 以 支持 大 约 两 倍 的 传输 率 。 一 些 Fast SCSI 和 Wide 
SCSI 系统 使 用 两 根 68 芯 电 缆 ， 它 们 可 以 支持 两 倍 的 传输 速率 ， 可 以 使 设备 数量 比 仅 使 用 一 根 
68 芯 电缆 的 系统 增加 一 倍 。 表 13-2 给 出 了 一 个 50 芯 SCSI 电费 的 引 脚 分 配 。 


表 13-2 SCSI D 型 连接 器 引 脚 
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终端 电源 

12V 或 5V 电 源 
12V 或 5V( 逻 辑 ) 
地 

数据 位 0 一 数据 位 7 


电机 电源 36 
12V 或 5V 电 源 | 37 | 
地 39, 40 
nAttention 41 


同步 42 


n reset 






















n SELect 
nC/D 
nREQuest 
nl/O 50 
































负 逻 辑 信号 由 一 个 小 写字 母 n 开头 。 当 取消 这 个 信号 时 ， 它 反而 是 有 效 的 


并 行 SCSI 设备 相互 通信 ， 主 机 适配器 使 用 一 个 分 为 8 个 阶段 运行 的 异步 协议 。 每 个 阶段 
都 定义 了 严格 的 时 序 。 也 就 是 说 ， 如 果 一 个 阶段 没有 在 一 定时 间 ( 之 秒 数 ) 内 完成 (取决 于 总 线 
速度 ) ， 那 么 认为 它 是 一 个 错误 ， 并 且 从 当前 阶段 的 开始 位 置 重新 启动 协议 。 正 在 发 送 数据 的 
设备 称 为 发 起 者 ， 目 的 设备 称 为 目标 。 下 面 描述 了 SCSI 协议 的 8 个 阶段 。 图 13-2 用 状态 图 解 
释 了 这 些 阶段 。 


总 线 = 目标 ID 
SEL 有 效 





队列 中 的 数据 
BSY 无 效 


图 13-2 并 行 SCSI 阶段 的 状态 图 ( 虚线 表示 错误 条 件 ) 


e 总 线 空 闲 : 询问 “总 线 忙 ”(BSsY) 信和 号 线 看 看 总 线 是 处 于 进入 下 一 阶段 之 前 的 使 用 状 
态 ， 还 是 数据 传输 完成 后 的 BSY 信和 号 无 效 状态 。 





。 仲裁 : 发 起 者 控制 总 线 的 方式 是 在 总 线 上 放置 它 的 设备 了 并 把 忙 信 号 置 为 有 效 。 如 果 
两 个 设备 同时 这 么 操作 ， 则 具有 最 高 设备 ID 的 设备 赢得 控制 总 线 权 。 主 机 必须 始终 拥 
有 最 高 的 设备 ID。 没 有 赢得 控制 权 的 设备 等 待 另 一 个 “总 线 空闲 ”状态 。 

。 选择 : 目标 设备 的 地 址 被 放置 在 数据 总 线 上 ,“ 选 择 ”(SEL ) 信号 置 为 有 效 ， 并 将 BSY 
信和 号 置 为 无 效 。 当 目标 设备 在 总 线 上 看 到 自己 的 设备 ID 以 及 处 于 有 效 的 SEL 、 无 效 的 
BSY 和 无 效 的 工 /0 信号 时 ， 它 把 BSY 信和 号 置 为 有 效 并 且 保 存 发 起 者 的 ID 供 以 后 使 用 。 
当 发 起 者 看 到 BSY 线 有 效 时 ， 就 知道 目标 设备 准备 就 绪 了 ,会 把 SEL 信号 置 为 无 效 并 
以 此 作为 响应 。 

。 命令 : 一 旦 目标 设备 检测 到 发 起 者 已 经 把 SEL 信号 置 为 无 效 ， 那 么 通过 在 “命令 / 数 
据 ”(cC/D) 线 上 设置 “准备 命令 ”信号 ， 表 明 已 经 准备 好 执行 一 个 命令 了 ， 并 通过 把 
REOQ 信号 置 为 有 效 来 请 求 这 个 命令 本 身 。 在 发 起 者 感觉 到 Cc/D 和 REQ 信号 置 为 有 效 
后 ， 它 在 数据 总 线 上 放置 第 一 个 命令 并 且 使 AcK 信号 有 效 。 目 标 设备 将 响应 由 此 发 送 
的 这 个 命令 ， 并 把 ACK 信号 置 为 有 效 以 便 确 认 已 经 接收 到 这 个 命令 。 如 果 命 令 还 有 后 
续 字 节 ， 那 么 使 用 ACK 信号 交换 ， 直 到 所 有 命令 字 节 传输 完 为 止 。 

此 时 ， 发 起 者 和 目标 设备 可 以 释放 总 线 ， 以 便 其 他 需要 使 用 总 线 的 设备 能 够 使 用 。 这 种 方 

式 允 许 有 更 高 的 并 发 性 ， 但 是 带 来 了 更 高 的 开销 ， 作 为 总 线 的 控制 在 数据 能 够 传输 给 发 起 者 之 
前 将 不 得 不 重新 谈判 。 

。 数据 : 当 目 标 设备 接收 到 完整 命令 之 后 ， 它 通过 设置 C/D 信号 为 无 效 使 总 线 成 为 “ 数 
据 ” 模 式 。 根 据 传输 数据 是 从 源 到 目标 的 输出 ( 比如， 磁盘 写 ) 还 是 从 源 到 目标 的 输入 
(比如 ， 磁 盘 读 ) ,“ 输 入 /输出 ” 线 分 别 被 置 为 无 效 或 有 效 。 然 后 一 些 字 节 放置 在 总 线 
上 并 且 进 行 传送 ， 而 且 使 用 与 命令 阶段 相同 的 “请 求 /应 答 ” 握手 信 号。 

。 状态 : 一 旦 传送 完 所 有 数据 ， 目 标 设备 通过 把 c/D 信和 号 置 为 有 效 使 总 线 回 到 命令 模 
式 。 它 然后 使 REQ 信号 有 效 并 且 等 待 发 起 者 发 送 的 应 答 ， 这 个 应 答 告 诉 它 ， 发 起 者 空 
闲 并 且 准 备 接收 一 个 命令 。 

。 消息 : 当 目 标 设备 感觉 到 发 起 者 做 好 准备 时 ， 它 把 “命令 完成 ”代码 放 在 数据 线 上 并 
且 使 “消息 ” 线 MSG 置 为 有 效 。 当 发 起 者 观察 到 “命令 完成 ”消息 时 ， 它 会 把 总 线 上 
的 所 有 信号 置 为 无 效 ， 从 而 使 总 线 回 到 “总 线 空 闪 ”状态 。 

。 重 选 : 在 一 个 传输 被 中 断 的 情况 下 (例如 ， 当 总 线 在 等 待 磁盘 或 磁带 服务 一 个 请 求 时 被 
释放 ) ， 总 线 的 控制 会 通过 如 上 所 述 的 仲裁 阶段 重新 进行 谈判 。 当 发 起 者 看 到 SEL 有 
效 、I/o 有 效 和 数据 线 上 目标 设备 的 ID 时 ， 发 起 者 确定 它 已 经 被 重 选 了 。 然 后 ， 该 协 
议 在 数据 阶段 恢复 。 

同步 SCSI 数据 传输 的 工作 方式 与 刚才 描述 的 异步 方法 相同 。 两 者 的 主要 区 别 是 每 个 数据 
字 节 的 传输 之 间 没 有 握手 要 求 。 相 反 ， 在 发 起 者 和 目标 之 间 要 商定 好 最 小 传输 周期 。 在 商定 好 
的 周期 时 间 内 交换 数据 。 在 发 送 下 一 个 数据 块 之 前 ， 将 会 发 生 一 次 请 求 /应 答 握 手 。 

很 容易 看 出 为 什么 时 序 对 SCSI 的 有 效 性 如 此 关键 。 当 设备 出 错时 ， 等待 时 间 的 上 限 可 以 
防止 接口 挂 起 。 如 果 不 是 这 样 的 话 ， 假 如 当 系 统 正在 访问 软盘 时 软盘 从 驱动 器 中 取出 了 ， 那么 
这 个 错误 操作 可 能 会 阻止 系统 对 硬盘 的 访问 ， 因 为 总 线 可 能 会 被 标记 为 “永远 ” 忙 ( 或 者 至 少 
到 系统 重新 启动 ) 。 信 和 号 通过 长 电缆 引起 的 信和 号 衰减 可 能 导致 超时 ， 使 得 整个 系统 变 慢 和 不 可 
靠 。 串 行 接口 更 能 容忍 时 序 的 变化 。 


13. 2. 2 SCSI 架构 模型 3 
SCSI 已 经 从 一 个 由 协议 、 信 号 和 连接 器 组 成 的 庞大 系统 发 展 成 为 一 个 分 层 接口 规范 ,将 
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物理 连接 与 传输 协议 和 接口 命令 分 离开 来 。 名 为 SCSI 架构 模型 3( SAM-3 ) 的 新 规范 定义 这 些 
层 以 及 它们 如 何 与 名 为 SCSI 基本 命令 ( SPC ) 的 命令 层 主 机 架构 之 间 相 互 作 用 ， 为 可 连接 到 计 
算 机 系统 的 几乎 任何 类 型 的 设备 执行 串 行 和 并 行 VO 操作 。 每 个 层 与 相 邻 层 的 通信 使 用 协议 服 
务 请 求 、 指 示 、 响 应 和 确认 。 这 些 松散 耦合 的 协议 栈 允 许 在 接口 硬件 、 软 件 和 介质 选择 方面 具 
有 最 大 的 灵活 性 。 对 某 一 层 的 技术 改进 对 其 他 层 的 操作 没有 影响 。SAM 的 灵活 性 为 磁盘 存储 
系统 打开 了 速度 和 适应 性 的 新 天 地 。 

图 13-3 显示 了 SAM 组 件 是 如 何 组 合 在 一 起 的 。 虽 然 这 个 架构 保留 了 与 SCSI 并 行 协议 和 接 
口 的 向 下 兼容 性 ， 但 是 最 大 和 最 快 的 计算 机 系统 现在 正在 使 用 的 是 串 行 方法 。SAM-3 串 行 协议 
是 串 行 存 储 结构 ( SSA) 、 串 行 总 线 ( 也 称 为 IEEE 1394 或 火线 ) 、 串 行 连接 SCSI、iSCSI 和 光 
纤 通 道 (FC) 。 由 于 SCSI 总 线 的 速度 和 SCSI 可 以 连接 系统 的 多 样 性 ， 所 以 在 “小 型 计算 机 系 
统 接口 ”中 的 “小 型 ”已 经 变 成 一 个 使 用 不 当 的 名 称 ，SCSI 的 变种 正在 用 于 从 最 小 的 个 人 计 
算 机 到 最 大 的 计算 机 主机 系统 中 。 
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SCSI-3 协 议 
(SSA-S3P) 
SCSI 并 行 接口 
(SPI-2、SPI-3、 


SPI-4、SPI-5) 
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图 13-3 ”SCSI 架构 模型 3 


每 一 个 SCSI 串 行 协议 都 有 自己 的 协议 栈 ， 这 个 栈 的 顶部 符合 它 定 义 的 SCSI 基本 命令 并 且 
在 底部 明确 定义 了 传输 协议 和 物理 接口 系统 。 串 行 协议 以 数据 包 ( 或 帧 ) 的 形式 发 送 数 据 。 这 
些 数据 包 由 一 组 含有 识别 信息 的 字 节 ( 数 据 包头 部 ) ， 一 组 数据 字 节 ( 称 为 数据 包 有 效 载荷 ) 和 
某 种 界定 数据 包 结 尾 的 字段 组 成 。 在 许多 SAM 协议 中 ， 纠 错 代 码 也 包含 在 数据 包 的 尾部 。 

我 们 将 在 下 面 的 部 分 中 讨论 一 些 更 邻 人 感 兴趣 的 SAM 串 行 协议 。 

IEEE 1394 

现在 称 为 IEEE 1394 的 接口 系统 起 源 于 苹果 电脑 公司 ， 当 时 它 看 到 了 需要 创建 一 个 比 20 
世纪 80 年 代 后 期 占 主 导 地 位 的 并 行 SCSI 系统 更 快 、 更 可 靠 的 总 线 需求 。 这 个 苹果 公司 称 为 火 
线 的 接口 今天 提供 的 总 线 速度 480MB/s， 预 计 在 不 久 的 将 来 它 会 有 更 高 的 速度 。 

IEEE 1394 不 仅 是 一 个 存储 接口 ， 它 还 是 一 个 点 对 点 存储 网 络 。 具 备 智 能 性 的 设备 ， 使 得 
其 除了 可 以 与 主机 控制 器 通信 之 外 ,设备 之 间 也 可 以 相互 通信 。 这 种 通信 和 包括 传输 速度 和 总 线 
控制 的 协商 。 这 些 功能 遍布 于 正 EE 1394 协议 层 ， 如 图 13-4 所 示 。 

IEEE 1394 不 仅 提供 了 上 比 早期 并 行 SCSI 更 快 的 数据 传输 速度 ， 而 且 它 还 使 用 了 更 细 的 线 
缆 ， 仅 有 6 根 导 线 ， 其 中 4 根 用 于 数据 和 控制 ，2 根 用 于 电源 。 较 细 的 线 缆 更 便宜 ， 而 且 比 有 
50 根 导线 的 SCSI-2 线 缆 更 容易 管理 。 此 外 ， 设 备 之 间 的 IEEE 1394 线 缆 长 度 能 够 扩展 到 15ft 
(4.5Sm) 。 它 可 以 在 一 个 总 线 上 以 菊花 链 方式 连接 多 达 63 台 设 备 。IEEE 1394 连接 器 是 模块 化 
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图 13-4 ”IEEE 1394 协议 栈 


整个 系统 是 自 配 置 的 ， 它 允许 大 量 设备 在 系统 运行 时 进行 简单 的 热 插 拔 ( 即 插 即 用 ) 。 然 
而 ， 热 插 拔 并 不 是 没有 代价 的 。 跟 踪 连 接 到 接口 上 的 设备 所 需 的 轮 询 会 在 系统 上 造成 开销 ， 这 
最 终 限制 了 它 的 吞吐 量 。 此 外 ， 如 果 一 个 连接 点 正 忙 着 处 理 同步 数据 流 ， 那 么 它 可 能 不 能 立即 
确认 传输 期 间 插入 的 设备 。 

设备 可 以 插入 到 其 他 设备 的 扩展 口中 ,构成 了 一 个 树 结构 ， 如 图 13-5 所 示 。 对 于 数据 WO 
来 说 ， 这 种 树 结构 的 用 途 有 限 。 由 于 它 支 持 同步 数据 传输 ， 所 以 IEEE 1394 在 消费 电子 领域 得 
到 了 广泛 认可 。 它 也 准备 超越 IEEE 488 通用 接口 总 线 ， 用 于 实验 室 数 据 采集 应 用 。 由 于 它 专 
注 于 实时 数据 处 理 ， 所 以 IEEE 1394 不 太 可 能 取代 SCSI 作为 大 容量 数据 存储 接口 。 

串 行 存储 架构 

串 行 存 储 架 构 ( SSA) 是 第 一 个 脱离 并 行 连 接 的 存储 接口 。 虽 然 SSA 已 经 被 其 他 技术 所 取 
代 ， 但 它 是 业界 对 于 存储 接口 思考 的 转折 点 。 在 20 世纪 90 年 代 初 ， 众 多 计算 机 制造 商都 在 寻 
找 一 种 快速 可 靠 的 用 于 大 型 机 磁盘 存储 系统 的 替代 并 行 SCSI 的 方法 ，IBM 是 这 些 计 算 机 制造 
商 之 一 。IBM 的 工程 师 决 定 在 串 行 总 线 上 对 长 时 间 运 行 的 电缆 提供 紧凑 性 和 低 衰 减 。 它 需要 提 
供 更 高 的 吞吐 量 和 对 SCSI-2 协议 的 向 下 兼容 性 。 到 1992 年 底 ，SSA 已 经 充分 细 化 ，IBM 将 其 
作为 一 个 标准 提交 给 AVSI。 该 标准 于 1996 年 底 获得 批准 。 

SSA 的 设计 在 一 个 环形 配置 中 支持 多 磁盘 驱动 器 和 多 主机 ， 如 图 13-6 所 示 。 四 芯 电缆 由 
两 对 铜 双 绞 线 组 成 (或 者 由 四 股 光纤 组 成 )， 人 允许 信和 号 在 环 路 中 以 相反 的 方向 传输 。 由 于 具有 
这 种 元 余 ， 所 以 如 果 一 个 驱动 器 或 主机 适配器 失效 ， 那 么 其 余 磁 盘 仍 保持 可 访问 性 。 

SSA 架构 的 双环 拓扑 也 允许 基本 吞吐 量 成 倍增 加 ， 即 从 40MB/s 增加 到 80MB/s。 如 果 所 有 
节点 都 正常 工作 ,那么 设备 可 以 以 全 双 工 方式 彼此 通信 (数据 同时 在 两 个 方向 上 循环 ) 。 

SSA 设备 可 以 管理 一 些 自己 的 V0。 例如， 在 图 13-6 中 ， 当 主机 适配器 B 正在 写 磁盘 3、 
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磁盘 1 正在 向 磁带 单元 发 送 数据 并 且 磁 盘 2 正在 向 打印 机 发 送 数据 时 ， 主 机 适配器 A 可 以 读 磁 
盘 0， 这 并 不 会 造成 总 线 本 身 的 吞吐 量 下 降 。IBM 称 这 种 想法 为 空间 重用 ， 因 为 如 果 源 和 目标 
之 间 有 明确 的 路 径 ， 那么 系统 的 任何 部 分 都 不 用 等 待 总 线 。 





可 读 写 光驱 





图 13-5 一 种 挂 满 消费 电子 产品 的 IEEE 1394 树 配 置 


由 于 它 的 简洁 、 速 度 和 可 靠 性 ，SSA 有 望 成 为 大 型 计算 机 系统 的 主要 互 连 方法 …… 直 到 光 
纤 通道 出 现 之 前 。 

光纤 通道 

1991 年 ， 位 于 瑞士 日 内 瓦 的 欧洲 核 研究 组 织 ( CERN) 实 验 室 的 工程 师 们 着 手 设计 一 种 通过 
光纤 介质 进行 因特网 通信 的 系统 。 他 们 称 这 种 系统 为 光纤 通道 ， 他 们 使 用 的 是 在 欧洲 “纤维 ” 
(fiber) 单 词 的 拼写 方法 。 第 二 年 ， 惠 普 公 司 、IBM 公司 和 Sun 微 系统 公司 组 成 了 一 个 联盟 ， 使 
光纤 通道 适用 于 磁盘 接口 系统 。 这 个 组 织 后 来 成 为 光纤 通道 协会 (FCA) ， 这 个 组 织 正 在 与 AN- 
SI 合作， 为 高 速 存 储 设备 接口 建立 一 个 完善 和 健壮 的 模型 。 虽 然 ， 最 初 是 使 用 光纤 进行 接口 ， 
但 是 光纤 通道 协议 也 可 以 用 于 双 绞 线 和 同 轴 铀 线 介 质 。 光 纤 通 道 存 储 系 统 可 以 有 3 种 拓扑 结 
构 : 交换 机 、 点 到 点 和 环 。 环 的 拓扑 结构 称 为 光纤 通道 仲裁 环 路 ( FC-AL) ， 它 是 3 种 光纤 通道 
拓扑 结构 中 使 用 最 广泛 也 是 最 昂贵 的 一 种 。 光 纤 通 道 拓扑 结构 如 图 13-7 所 示 。 

FC-AL 在 一 个 方向 上 提供 速度 为 100MB/s 的 数据 包 传输 。 理 论 上 在 环 路 上 最 多 有 127 台 设 
备 ， 但 60 台 是 实际 的 限制 。 

注意 ,图 13-7 显示 了 FC-AL 的 两 个 版 本 ， 图 13-7b 中 没有 而 图 13-7c 中 有 一 个 名 为 集线器 
的 简单 交换 设备 。FC-AL 集线器 配备 了 旁 路 开关 端口 ， 当 一 个 FC- AL 磁盘 失效 时 它 可 以 确保 
环 路 连通 。 如 果 没 有 某 种 类 型 的 旁 路 能 力 ， 那 么 只 要 有 一 个 磁盘 不 能 使 用 时 ， 整 个 环 路 将 都 失 
效 。( 把 这 种 方式 与 SSA 进行 比较 。) 因此 ， 把 一 个 集线器 加 到 配置 中 引入 了 失效 后 援 保护 。 因 
为 集线器 本 身 可 能 会 变 成 一 个 故障 点 (虽然 不 经 常 失 效 ) ， 所 以 要 给 系统 可 用 性 要 求 高 的 设施 
提供 见 余 集线器 。 





SSA | 设备 控制 器 
i | eee 








磁盘 单元 0 磁盘 单元 1 磁带 单元 0 
图 13-6 一 种 串 行 存储 架构 (SSA) 的 配置 





c ) 带 有 集线器 的 环 路 d ) 交换 机 ( 星 形 配置 ) 
图 13-7 光纤 通道 的 拓扑 结构 
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交换 式 光纤 通道 存储 系统 比 FC- AL 提供 了 大 得 多 的 带宽 ， 它 对 连接 到 接口 上 的 设备 数量 
(上 限 是 2”) 没 有 特别 的 限制 。 在 交换 机 和 节点 之 间 可 以 支持 速度 100MB/s 的 连接 。 因 此 ， 当 
CPU 正在 与 一 个 磁盘 以 100MB/s 的 速度 传送 数据 期 间 ， 另 外 两 个 磁盘 之 间 能 够 同时 以 100MB/s 
的 速度 传送 数据 ， 等 等 。 交 换 式 光纤 通道 配置 比 环 路 配置 更 昂贵 ， 因 为 为 了 确保 连续 运行 ， 更 
复杂 的 交换 组 件 必 须 是 宛 余 的 。 

光纤 通道 是 数据 网 络 和 存储 接口 的 融合 。 它 有 一 个 符合 SAM 和 国际 公认 的 网 络 协议 栈 。 
这 个 协议 栈 如 图 13-8 所 示 。 由 于 具有 更 高 层 的 协议 映射 所 以 光纤 通道 存储 配置 不 一 定 要 求 
和 CPU 直接 连接 : 光纤 通道 协议 栈 可 以 封装 在 一 个 网 络 传输 包 中 ， 也 可 以 直接 作为 SCSI 命令 
传送 。FC-4 层 处 理 这 些 细节 。 


dy 通道 协议 网 络 协 议 
更 上 层 协 议 (如 SCSI、HIPPI) ( 如 因特网 、 局 域 网 ) 
Pe “和 更 上 层 协 议 映射 
(更 上 层 协 议 到 公共 服务 命令 的 转换 ) 
服务 ; 


FC-3 命令 
(设备 用 于 多 端口 设备 ， 通 过 多 通道 分 段 ， 多 播 等 ) 








Fc2 | i 帧 ” 帧 流 控制 和 环 路 仲裁 ; FC-PH 
ANSI X3.230 
pc ha 
信号 接口 


i 物理 接口 
(信号 层 、 时 序 、 介 质 规范 等 ) 3 


图 13-8 光纤 通道 协议 栈 


在 FC-2 层 产 生 协 议 包 (或 帧 ) ， 它 们 包含 来 自 更 上 层 更 上 层 的 数据 或 命令 以 及 来 自 更 下 层 
的 数据 或 响应 。 如 图 13-9 所 示 ， 这 个 包 的 大 小 固定 为 2148 字 节 ， 其 中 36 字 节 用 于 定 界 、 路 由 
和 错误 控制 。 







| 
| 64 | 
帧 开始 “| 帧 头 部 | 一 一 循环 | 帧 结束 


指示 器 可 先 炸 据 有 效 载 共 宛 余 校 验 | 指示 器 
错误 控制 


> eC * 可 选 头 部 不 是 光纤 通道 规范 的 一 部 分 。 
-> Se 当 与 其 他 协议 接口 时 它 用 于 提供 兼容 性 













流 控制 
十 六 进 制 ) 
(作为 一 个 ( FC-0 用 它 防 
响应 包 、 光纤 信道 帧 的 。 | 止 缓冲 区 溢出 ) 
数据 包 等 ) 标签 识别 包 ) 


载荷 的 


(在 交换 ID 的 |“ ( 当 使 用 了 可 ”| “(由 发 起 者 分 配 | 。( 由 响应 都 配 | 的 相对 位 移 
所有 N 包 的 数 外)| 法文 部 由 时。 | 的 人 区 换 ID ) | 的 介入 交换 ID ) 
为 非 零 ) 





图 13-9 ”光纤 通道 的 协议 包 





当 给 FC-AL 环 路 供电 时 ， 它 自己 开始 初始 化 。 在 初始 化 时 ， 参 与 的 设备 要 说 明 自 己 、 协 
商 设备 (或 端口 ) 号 并 选 一 个 主 设备 。 数 据 传输 通过 分 组 交换 进行 。 

FC-AL 是 一 种 点 对 点 协议 ， 这 在 某 些 方面 类 似 于 SCSI。 每 次 仅 有 两 个 节点 (发 起 者 和 响应 
者 ) 能 够 使 用 总 线 。 当 一 个 发 起 者 想 要 使 用 总 线 时 ， 它 在 总 线 上 放 一 个 名 为 ARB (x) 的 特殊 信 
号 。 这 意味 着 设备 x 希望 仲裁 控制 总 线 。 如 果 没 有 其 他 设备 控制 总 线 ， 那 么 环 路 中 的 每 个 节点 
ws ARB (x) 信号 传 给 它 的 上 游 邻 居 ， 直 到 这 个 信息 包 回 到 发 起 者 那里 。 当 发 起 者 看 到 ARB 

x) 在 总 线 上 没有 改变 时 ， 它 就 知道 已 经 赢得 了 对 总 线 的 控制 。 

A 经 控制 了 环 路 ， 那 么 ARB (x) 信息 包 在 回 到 发 起 者 之 前 将 改变 为 ARB 

。 发 起 者 然后 再 次 尝试 。 如 果 两 个 设备 在 同一 时 刻 都 试图 得 到 总 线 控制 权 ， 那么 节点 号 
dp 而 另外 一 个 节点 随后 再 试 。 

发 起 者 通过 与 响应 者 打开 一 个 连接 的 方式 控制 总 线 。 这 是 通过 发 送 一 个 OPN (yy ) 命令 (用 
于 全 双 工 ) 或 OPN (yx)( 用 于 半 双 工 ) 命令 来 实现 的 。 在 收 到 OPN (??) 命令 时 ， 响 应 者 进入 
“就 绪 ” 状 态 并 且 给 发 起 者 发 送 “ 接 收 者 就 绪 ” (R_RDY ) 命令 的 方式 来 通知 发 起 者 。 一 旦 数据 
传输 完成 ， 发 起 者 发 出 一 个 “关闭 ”命令 (cLS) ， 并 释放 对 环 路 的 控制 。 

数据 传输 协议 的 细节 取决 于 环 路 或 光纤 中 所 使 用 的 服务 类 别 。 有 些 类 别 要 求 确认 数据 包 
(用 于 最 高 精度 ) ， 有 些 则 不 要 求 确认 (用 于 最 高 速度 ) 。 

在 本 文中 ， 光 纤 通 道 数据 传输 定义 了 5 种 服务 类 型 。 在 实际 产品 中 并 没有 实现 所 有 的 这 些 
服务 类 型 。 此 外 ， 如 果 有 足够 的 可 用 带宽 ， 那 么 可 以 混合 一 些 服务 类 型 。 当 环 路 或 通道 没有 被 
类 型 1 使 用 时 ， 一些 实现 允许 传输 类 型 2 和 类 型 3 的 帧 。 表 13-3 总 结 了 目前 为 光纤 通道 定义 的 
各 种 类 型 服务 。 


表 13-3 光纤 通道 服务 类 型 





1 | 记 攻 所 但 机 的 专用 过 持 。 由 于 连接 管理 的 复杂 性 ， 所 以 许多 供应 商 不 支持 它 





类 似 于 类 型 1， 但 是 不 需要 专用 连接 。 当 数据 包 需 要 通过 网 络 中 不 同 路 径 传送 时 ， 数 据 包 可 以 不 
按 顺序 发 送 。 类 型 2 适用 于 低 流 量 、 不 经 常 出 现 突 发 流量 的 场合 


无 连接 、 非 确认 传递 。 数 据 包 的 传递 和 顺序 由 更 上 层 协议 管理 。 在 带宽 充裕 的 小 网 络 中 ， 传 输 通 
常 是 可 靠 的 。 由 于 需要 协议 协商 临时 路 径 ， 所 以 它 更 适合 于 FC-AL 


虚 电 路 切 分 网 络 的 全 部 带宽 。 例 如 一 个 100MB/s 的 网 络 可 以 支持 一 个 75MB/s 和 一 个 25MB/s 的 














4 连接 。 这 些 虚 电路 中 的 每 一 个 都 允许 使 用 不 同类 型 的 服务 。 在 2002 年 ， 在 市 场 上 还 没有 类 型 4 的 
商业 产品 

从 一 个 带 有 确认 传递 的 源 多 播 到 其 他 源 。 这 对 音频 和 视频 广播 有 用 。 为 防止 广播 节点 洪 泛 ( 在 将 

6 要 发 生 时 ， 使 用 类 型 3 连接 进行 广播 ) ， 一 个 单独 的 节点 将 放置 在 网 络 上 管理 广播 确认 。 截 至 2002 


年 ， 没 有 类 型 6 的 实现 推 向 市 场 





13.3 因特网 SCSI 


伴随 着 光纤 通道 卓越 的 性 能 和 扩展 能 力 ， 它 的 主要 问题 是 : 硬件 组 件 昂 贵 以 及 光纤 通道 协 
议 呈 现 出 的 可 怕 的 学 习 曲 线 。 伴 随 着 比较 便宜 的 技术 的 不 断 出 现 ， 这 些 因 素 给 高 性 能 企业 存储 
使 用 一 些 替 代 方 案 提供 了 机 会 。 因 特 网 SCSI(iSCSI) 是 最 被 看 好 的 一 种 ， 它 利用 好 理解 的 因 特 
网 和 局 域 网 协议 为 SCSI 命令 和 数据 提供 快速 、 可 靠 的 传输 服务 。 

在 iSCSI 背后， 总 的 思路 是 用 因特网 取代 SCSI 总 线 ， 如 图 13-10 所 示 。 虽 然 概 念 很 简单 ， 
但 是 协议 开销 很 大 。 当 主机 发 送 数据 到 一 个 iSCSI 磁盘 阵列 时 ，SCSI 数据 被 封装 为 一 个 iSCSI 
有 效 载荷 ， 它 又 作为 TCP 的 有 效 载荷 。 这 个 TCP 包 被 放 入 一 个 或 多 个 全 包 中 ， 这些 包 本 身 在 
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一 个 或 多 个 千 兆 位 以 太 网 帧 中 也 是 一 个 有 效 载荷 ， 如 图 13-11 所 示 。 以 太 网 帧 通过 网 络 ( 传输 
距离 可 以 从 米 到 千 米 ) 传 送 到 磁盘 阵列 的 以 太 网 接口 。 协 议 栈 上 层 数据 包 的 有 效 载荷 会 被 提取 
出 来 ， 直 到 它 最 后 写 入 磁盘 。 重 要 的 是 要 记 住 : 由 于 TCP、IP 以 及 传输 路 径 上 各 种 硬件 组 件 的 
限制 ， 数 据 传输 可 能 跨越 多 个 以 太 网 帧 。 





a ) 传统 并 行 SCSI b ) iSCSI 的 协议 栈 
图 13-10 用 因特网 奉 代 SCSI 总 线 


不 像 光 纤 通 道 ，iSCSI 没有 距离 限制 。 
理论 上 ， 使 用 iSCSI 可 以 保存 一 个 文件 到 看 
似 是 本 地 的 磁盘 驱动 器 ， 但 是 实际 上 它 最 终 
可 能 被 保存 到 数 千 公 里 之 外 。 这 种 想法 忽略 
了 长 距离 文件 传输 的 延迟 特性 一 一 用 户 肯 定 
会 注意 到 出 现 的 延迟 。 为 了 提供 可 以 接受 的 
性 能 ，iSCSI 需要 尽 可 能 快 的 网 络 连接 (在 写 
本 书 时 ， 推 荐 的 是 万 兆 位 以 太 网 ) 和 基于 硬 
件 的 TCP 处 理 器 ， 它 称 为 TCP 减负 引擎 
(TOEs ) 。 图 13-11 因特网 SCSI 协议 数据 单元 (PDU) 封 装 

对 因特网 的 安全 性 和 传输 完整 性 问题 提出 了 额外 的 挑战 ， 这 些 对 于 一 个 单独 的 光纤 通道 装 
置 来 说 ， 在 很 大 程度 上 可 能 会 被 忽略 。 然 而 ， 这 些 问 题 在 iSCSI 中 成 了 突出 的 问题 。iSCSI 的 安 
全 措施 包括 加 密 和 和 防火墙。 传输 完整 性 是 由 外 部 协议 层 和 使 用 32 位 CRC 来 保护 iSCSI 有 效 载 
荷 本 身 来 提供 的 。 错 误 的 数据 包 会 重新 传送 ,除非 TCP 或 P 会 话 失效 ， 在 这 种 情况 下 结束 该 
连接 并 重新 建立 连接 。 

一 个 组 织 并 不 是 非 要 在 使 用 iSCSI 还 是 使 用 光纤 通道 之 间 做 出 选择 。 这 两 种 技术 可 以 结合 
用 ， 从 而 互补 。 光 纤 通 道 最 适合 于 高 吞吐 量 的 应 用 ，iSCSI 为 不 经 常 使 用 的 数据 提供 更 大 的 存储 


SCSI 命 令 
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池 。 对 iSCSI 而 言 ， 为 高 可 用 性 光纤 通道 装置 提供 一 个 划算 的 远程 镜像 站 点 是 一 种 标准 用 法 。 


13.4 存储 区 域 网 络 

光纤 通道 和 万 兆 以 太 网 等 提供 的 快速 网 络 连接 已 经 能 够 建立 专门 用 于 存储 访问 和 管理 的 专 
用 网 络 。 这 些 网 络 称 为 存储 区 域 网 络 ( SAN) 。SNA 在 逻辑 上 扩展 了 本 地 存储 总 线 ， 使 得 所 有 
小 型 、 中 型 和 大 型 计算 机 平台 都 可 以 访问 存储 设备 集 。 存 储 设备 可 以 和 主机 放 在 一 起 ， 也 可 以 
放 在 数 英里 之 外 作为 主 处 理 站 点 的 “ 热 ” 备 份 。 

与 网 络 附加 存储 模型 (NAS) 相 比 ，SAN 对 大 量 存储 提供 了 更 简洁 和 更 快速 的 访问 。 在 典 
型 的 NAS 系统 中 ， 所 有 文件 访问 必须 经 过 特定 的 文件 服务 器 ， 并 会 导致 所 有 的 协议 开销 和 与 
该 网 络 相 关 的 流量 拥塞 。 磁盘 访问 协议 (SCSI 架构 模型 3 的 命令 ) 被 说 入 在 网 络 数 据 包 内 ， 需 
要 两 层 协议 开销 和 两 次 数据 包 的 组 包 / 解 包 操作 。 

SAN 有 时 称 为 “网 络 背 后 的 网 络 "， 与 普通 网 络 流量 是 分 开 的 。 光 纤 通 道 存 储 网 络 ( 无 论 交 换 
机 还 是 FC- AL) 可 能 比 NAS 系统 快 得 多 ， 因 为 它们 仅 通过 一 个 协议 栈 。 因 此 ， 它 们 会 绕 过 传统 的 
文件 服务 器 ， 这 样 可 以 降低 网 络 流量 。 在 图 13-12 和 图 13-13 中 比较 了 NAS 和 SAN 配置 。 





图 13-12 网 络 附加 存储 


因为 光纤 通道 SAN 独立 于 任何 特定 的 网 络 协议 (如 以 太 网 ) 或 专用 主机 附件 ， 所 以 它们 可 
以 通过 更 上 层 协议 进行 访问 ， 它 们 可 以 被 任何 平台 配置 以 识别 SAN 存储 设备 。 甚 至 在 最 复杂 
的 SAN 中 ,存储 管理 也 会 大 大 简化 ， 因 为 所 有 存储 器 都 在 单一 的 SAN 上 (相对 于 各 种 各 样 的 文 
件 服务 器 和 磁盘 阵列 ) 。 数 据 可 以 通过 电子 传输 保存 在 远程 站 点 或 者 备份 到 磁带 上 ， 而 不 干扰 
网 络 或 主机 操作 。 因 为 它们 具有 的 速度 、 灵 活性 和 健壮 性 ， 所 以 SAN 正在 变 成 为 庞大 用 户 群 
体 提供 高 可 用 性 和 TB 量 级 存储 的 首选 。 


13.5 其 他 1/O 连接 


一 些 VO 架构 处 于 SCSI-3 架构 模型 范围 之 外 ,但 是 在 某 种 程度 上 可 以 与 它 接口 。 其 中 最 
流行 的 是 用 于 绝 大 多 数 低 端 计算 机 中 的 AT 嵌入 式 接口 (ATA)。 除 了 Intel 的 VO 连接 模式 之 
外 ， 为 计算 机 架构 设计 的 其 他 0 连接 已 经 在 各 种 类 型 的 平台 上 得 到 了 广泛 应 用 。 下 面 将 介绍 
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一 些 更 受 欢 迎 的 IO 连接 。 
Sy | 
一 
局 域 网 Es 
应 用 服务 器 
a 
光纤 通道 交换 机 
SCSI 阵 列 | 加 国 
回回 | RAID 5 
RAIDO 一 RAID5 wm 2 回国 
阵列 各 目 We >> 吾 妃 阵列 S89 


iSCSI 交换 机 
回国 
已 日 光纤 通道 交换 机 已 已 RAID 5 
降 列 ， 赎 -十 队列 ” SS 
SS RAID 5 
Se @G | 自动 磁带 库 
RAID 1 已 晶 


图 13-13 存储 区 域 网 络 (SAN) 


13. 5. 1 并 行 总 线 : XT 到 ATA 


第 一 台 IBM PC 使 用 的 是 一 种 名 为 PC/XT 的 8 位 总 线 。IEEE 接受 并 重新 命名 它 为 工业 标准 
架构 (1SA) 总 线 。 它 最 初 运行 的 速度 是 2.38MB/s， 并且 访问 一 个 16 位 存储 器 地 址 需要 两 个 周 
期 ， 因 为 它 的 宽度 很 窗 。 由 于 XT 运行 的 速度 是 4.77MHz， 所 以 XT 总 线 提供 了 充足 的 性 能 。 
随 着 带 有 80286 处 理 器 的 PC/AT(“AT” 为 先进 技术 ) 的 引入 ,显然 8 位 总 线 不 再 有 用 。 直 接 的 
解决 办 法 是 把 总 线 加 宽 到 16 位 ， 把 时 钟 频 率 提 升 到 8MHz， 并 称 之 为 “AT 总线 ” 。 然 而 ， 没 过 
多 和 久 ， 当 微 处 理 器 速度 开始 超过 25MHz 时 ， 新 的 AT 成 为 了 严重 的 瓶颈 。 

对 于 这 个 问题 ， 这 些 年 来 已 经 有 了 不 同 的 解决 方案 。 在 这 些 解决 方案 中 最 持久 的 是 具有 不 
同 变化 的 AT 总 线 的 前 身 ， 称 其 为 AT 嵌入 式 接口 (ATA) 、ATAPI、 快 速 ATA 和 EDID。FEIDE 
是 增强 型 集成 驱动 电子 的 缩写 ， 之 所 以 有 这 样 的 名 字 是 因为 通常 放 在 磁盘 驱动 器 接口 卡 中 的 许 
多 控制 功能 被 转移 到 了 磁盘 驱动 器 本 身 的 控制 电路 中 。ATA 在 为 磁盘 驱动 器 和 其 他 设备 提供 
32 位 接口 的 同时 ， 也 提供 与 16 位 AT 接口 卡 的 向 下 兼容 性 。 没 有 外 围 设 备 能 够 直接 连 到 ATA 
总 线 上 。 内 部 设备 的 数量 不 能 超过 4 个。 根据 使 用 的 是 编程 控制 /O 还 者 DMA LO，ATA 总 线 
可 以 支持 22MB/s 或 16.7MB/s 传输 率 以 及 100MB/s 的 理论 最 大 值 。Ultra ATA 提供 133MB/s 的 
突 发 速率 传输 。 在 这 样 的 速度 下 ，ATA 为 今天 市 场 上 的 小 型 系统 总 线 提供 了 最 有 利 的 性 价 比 。 
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13. 5.2 串 行 ATA 和 串 行 连接 的 SCSI 


尽管 它 有 令 人 满意 的 性 能 和 低 成 本 ， 但 ATA 正在 从 小 型 系统 中 淡出 。 随 着 处 理 器 速度 的 
提高 ， 甚 至 Ultra ATA 也 开始 成 为 瓶颈 。 此 外 ， 更 快 的 处 理 器 会 产生 大 量 的 热量 ， 热 量 必须 从 
处 理 器 和 其 他 敏感 元 器 件 处 排出 。 在 主 系统 外 壳 内 的 任何 阻碍 空气 流动 的 东西 都 是 问题 ， 并 行 
ATA 的 2in(1in =0.0254m) 扁平 电缆 绝对 阻碍 空气 流动 。 考 虑 到 这 一 点 ， 下 一 代 ATA 接口 被 设 
计 成 串 行 接口 。 串 行 ATA 或 SATA 接口 支持 的 传输 率 比 并 行 连接 能 够 提供 的 要 快 得 多 ， 而 且 
仅 需 要 7 根 (4 根 数据 线 、3 根 地 线 )1/4in 长 的 电线 。 

除了 更 细 的 电缆 外 ，SATA 有 许多 吸引 人 的 特征 ， 它 们 包括 : 

e 比 并 行 ATA 更 快 的 数据 传输 率 : 300MB/s 对 133MB/s( 突 发 速率 ) ; 近期 不 久 会 有 更 快 
速 的 ATA 
更 低 的 电压 : 500mV 对 3.0 或 5.0V 
更 长 的 电缆 : lm 对 0. Sm 
与 并 行 ATA 的 软件 具有 兼容 性 一 一 对 驱动 器 、BIOS 或 所 要 求 的 操作 系统 没有 变化 
增强 的 错误 校 验 : 32 位 CRC 用 于 所 有 的 位 ， 而 并 行 Ultra ATA 的 CRC 仅 用 于 数据 

。 点 到 点 配置 ， 而 不 是 主 从 配置 ， 这 使 接口 上 的 各 种 设备 可 以 同时 传递 数据 

对 ATA 的 许多 改进 也 移植 到 一 些 名 为 串 行 连接 SCSI 或 SAS 的 SCSI 串 行 版 本 上 。SAS 的 
插头 和 电缆 与 SATA 相同 ， 并 且 系 统 支 持 ATA 和 SCSI， 在 开机 时 这 个 设备 将 自己 与 主机 区 分 
开 。SAS 通过 一 个 数据 传输 速率 高 达 300MB/s 的 背 板 总 线 进 行 连 接 。SAS 具有 极 大 的 可 伸缩 
性 ， 在 一 个 域 中 理论 上 可 以 有 16 000 多 台 设 备 。 有 了 这 些 优点 ， 显 然 SAS 和 SATA 驱动 器 完全 
取代 并 行 接口 只 是 时 间 上 的 问题 。 


13. 5. 3 ”外围 设备 互 连 


到 1992 年 ，AT 总 线 已 经 成 为 影响 整个 小 型 系统 性 能 的 主要 因素 。 由 于 担心 AT 总 线 已 经 
达到 使 用 寿命 ， 所 以 Intel 资助 了 一 个 工业 小 组 ， 为 小 型 系统 设计 更 快 、 更 灵活 的 VO 总 线 。 
外 围 设备 互 连 ( PCI) 就 是 他 们 努力 的 结果 。 

PCI 总 线 是 对 系统 数据 总 线 的 一 种 扩展 ， 正 在 取代 系统 上 的 任何 其 他 IO 总 线 。PCI 的 宽 
度 是 一 个 CPU 字 ， 和 运行 速度 是 66MHz。 因 此 ， 对 于 一 个 32 位 CPU 来 说 ， 理 论 上 的 数据 吞吐 量 
是 264MB/s[ 66MHz x (32 位 :8 位 / 字 节 ) =264MB/s] 。 对 于 运行 于 66MHz 的 64 位 总 线 来 说 ， 
其 最 大 传输 率 是 528MB/s。 虽 然 PCI 连接 到 系统 总 线 ， 但 它 可 以 自主 协商 总 线 速度 和 数据 传 
输 ， 而 不 需要 CPU 干预 。PCI 是 快速 和 灵活 的 。PCI 的 各 种 版 本 可 用 于 小 型 家 用 计算 机 以 及 支 
持 数据 采集 和 科学 研究 的 大 型 、 高 性 能 系统 中 。 


13. 5.4 串 行 接口 USB 


通用 串 行 总 线 (USB) 不 是 一 种 真正 的 总 线 ， 但 它 是 通用 的 。USB 是 一 种 串 行 外 围 设 备 接 
口 ， 被 几乎 所 有 可 充电 或 存储 数据 的 电子 消费 产品 所 使 用 。USB 规范 受 名 为 USB 开发 者 论坛 
(USB-IF ) 的 设备 制造 商 联 盟 所 控制 。 到 目前 为 止 已 经 有 3 个 主要 版 本 的 USB， 从 1996 年 的 
USB 1.0 开始 ， 到 2013 年 的 最 流行 的 USB 3. 1。 速 度 已 经 从 USB 1.0 提供 的 12Mbit/s 增加 到 
USB 3. 1 超速 模式 的 10Gbit/s。 由 无 处 不 在 的 USB 2. 0 提供 的 280Mbit/s 的 速度 足以 满足 大 多 数 
日 常 文件 的 传输 要 求 。USB 3. 1 更 适合 批量 传输 ， 如 磁盘 备份 和 视频 流 的 同步 传输 。USB 3. 1 
向 后 兼容 到 USB 2. 0 所 有 版 本 。 

USB 需要 主机 中 有 一 个 名 为 根 集线器 的 适配器 卡 。 根 集线器 连接 到 一 个 或 多 个 外 部 多 端口 
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集线器 上 ， 多 端口 集线器 能 够 直接 连接 到 各 种 各 样 的 外 围 设备 上 ， 包 括 摄像 机 和 电话 。 多 端口 
集线器 可 以 级 联 五 级 ， 通 过 一 个 根 集线器 可 以 支持 多 达 127 台 设 备 。 主 机 通过 设备 各 自 唯 一 的 
ID 可 以 以 菊花 链 方式 连接 和 编 址 。 

USB 的 目标 是 使 附加 外 围 设备 像 “ 把 电话 插 进 墙 上 的 插座 ”那样 简单 ， 尽 管 在 过 去 10 年 
设备 类 型 不 断 增加 ， 但 它 已 经 实现 了 这 一 目标 。USB 的 即 插 即 用 功能 使 得 从 来 不 知道 冲突 中 断 
请 求 向 量 和 需要 交换 并 重新 焊接 插头 上 一 些 线 的 苦恼 的 人 们 失去 成 就 感 。USB 通过 发 布设 备 驱 
动 软件 和 主机 设备 协议 实现 即 插 即 用 功能 ， 这 个 协议 将 设备 与 各 自 的 驱动 程序 相关 联 。 

当 一 个 设备 搬入 主机 系统 时 ， 必 须 执行 以 下 几 个 步骤 : 

1. 当 一 个 设备 插入 USB 端口 时 ， 这 个 端口 的 电气 状态 会 发 生 改 变 。 主 机 系统 检测 到 这 个 
变化 并 将 这 个 数据 包 重 置 并 发 送 回 该 设备 。 

2. 主机 请 求 设备 的 设备 描述 符 信 息 。 这 些 信息 包括 设备 类 型 、 设 备 制 造 商 的 代码 (由 US- 
BIF 分 配 ) 、 制 造 商 的 产品 四 和 USB 规格 编号 (例如 ，1.0、2.0 等 ) 。 

3. 一 旦 主机 能 够 得 到 这 些 信息 ， 那 么 就 加 载 与 产品 四 相对 应 的 设备 驱动 程序 。 

4. 主机 可 以 向 设备 请 求 一 个 或 多 个 配置 描述 符 。 只 要 设备 有 多 种 配置 ， 这 一 步 是 必要 的 。 

5. 一 旦 了 解 了 设备 的 特性 并 加 载 了 适当 的 驱动 程序 后 ， 主 机 就 向 设备 发 送 分 配 地 址 。 主 
机 和 设备 现在 已 经 准备 好 协商 数据 传输 了 。 

USB 支持 4 种 不 同 的 数据 传输 模式 ， 每 一 种 都 有 自己 的 底层 协议 ; 

控制 传输 一 一 在 主机 和 设备 之 间 交 换 协 议 (如 即 插 即 用 ) 和 设置 其 他 传输 类 型 。 

同步 传输 一 一 时 间 敏 感 的 数据 传输 ， 如 音乐 和 视频 。 

中 断 传 偷 ， 如 由 鼠标 和 键盘 产生 的 数据 传输 。 

成 块 传输 一 一 在 主机 和 成 块 数据 设备 之 间 ( 如 闪存 驱动 器 、 照 相机 和 扫描 仪 ) 的 数据 传输 。 

USB 电缆 仅 需 要 4 根 导 线 : 2 根 用 于 数据 传输 ，1 根 用 于 电源 ( +5V)，! 根 用 于 地 。USB 
3.0 把 4 根 导线 增加 到 6 根 : 4 根 专用 于 信号 ，1 根 信号 地 线 ，1 根 用 于 管理 USB OTC。USB 
OTG， 自 从 USB1. 1 之 后 便 开始 使 用 ， 人 允许 一 个 设备 在 同一 个 连接 中 既 充 当主 机 也 充当 从 设 
备 。 平板 电脑 通常 会 使 用 USB 0TG， 因 为 它们 连接 到 外 围 设备 ( 比如 键盘 ) 时 可 以 是 主机 ， 连 
接 到 台式 计算 机 传输 文件 时 可 以 是 从 设备 。 

便携 设备 制造 商 快速 开发 了 在 USB 2.0 端口 上 可 以 很 容易 获得 5V 电压 /500mA 电流 的 电 
源 ， 而 且 很 快 就 可 以 成 为 各 种 便携 设备 的 充电 站 。(USB 3.0 提供 900mA 的 电流 ) 。 为 此 ， 
USB-IF 于 2009 年 发 布 了 《电池 充电 规范 》。USB-IF 观察 到 , “USB 已 经 从 一 个 能 提供 有 限 电量 
的 数据 接口 发 展 成 一 个 有 数据 接口 的 电源 的 主要 提供 者 。” 这 个 规范 包括 一 个 即 插 即 用 功能 以 
确定 对 附加 设备 进行 充电 的 最 佳 方式 。 

对 于 USB 1.0 的 主要 反对 意见 是 数据 传输 率 表 13-4 4 各 各 USB 版 本 的 数据 传输 率 
慢 ， 所 以 计算 机 制造 商 对 于 键盘 和 鼠标 之 外 的 其 ”十 下 于 0 有 有 
他 任何 设备 都 迟 迟 不 采用 它 。 后 来 ， 数 据 传输 率 










12Mbit/s 





1.0 











已 经 稳步 提升 到 USB 3. 1 的 10Gbit/s。 这 些 数据 2.0 480Mbit/s 
传输 率 的 演化 如 表 13-4 所 示 。 3.0 2008 S Chi 
USB 无 疑 是 最 重要 和 最 成 功 的 计算 机 接口 。 3 1 2013 10Gbitys 


没有 其 他 类 型 的 连接 能 够 接 入 如 此 多 的 设备 类 
型 ， 从 最 小 的 MP3 播放 器 ， 到 智能 手机 ， 再 到 文件 服务 器 。 它 通过 其 性 能 和 易 用 性 实现 了 这 
种 渗透 。 这 也 是 设备 制造 业 通过 标准 化 和 合作 实现 的 一 个 光 辉 范例 。 
13.6 云 存储 
云 存 储 建立 在 第 1 章 和 第 9 章 提 到 的 云 计算 思想 上 。 云 存储 提供 了 通过 因特网 访问 的 可 伸 
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缩 的 数据 存储 平台 。 与 云 计算 类 似 ， 云 存储 背后 的 理念 是 : 按 所 使 用 的 存储 容量 付费 。 能 力 是 
有 弹性 的 : 它 可 以 按 需 求 分 配 和 释放 。 服 务 器 在 匈 余 集群 中 配置 ， 以 提供 故障 后 援 保护 和 可 伸 
缩 的 体系 结构 。 
云 存 储 能 力 根据 用 户 的 使 用 方式 有 很 大 的 不 同 。 消 费 级 存储 提供 了 一 个 方便 的 平台 ， 消 费 
者 可 以 从 全 世界 任何 地 方 访问 这 个 平台 。 在 这 个 领域 中 几 个 著名 的 提供 商 包 括 亚马逊 云 驱动 
器 、 苹 果 iCloud 、Dropbox 、 微 软 SkyDrive 和 CX 等 ， 这 里 仅 举 几 个 例子 。 到 2013 年 底 ， 根 据 存 
储 器 的 特征 ， 每 GB 每 月 的 价格 在 0. 04 ~ 0. 12 美元 之 间 。 绝 大 部 分 提供 商 免 费 提 供 少量 的 存储 
空间 ， 只 有 在 达到 一 定 的 用 量 后 才 收 费 。 
企业 级 云 存 储 是 一 个 适合 于 存储 一 个 组 织 最 宝贵 资产 (数据 ) 的 平台 。 当 需要 的 时 候 ， 这 
些 数据 必须 是 可 以 访问 的 ， 而且 必 须 防止 未 经 授权 的 访问 。 企 业 必须 能 够 控制 在 给 定时 间 内 谁 
可 以 访问 数据 。 不 同 于 消费 级 云 服 务 ， 企 业 级 云 存储 必须 满足 一 定 程度 的 性 能 要 求 。 提 供 商 基 
于 服务 参数 和 数据 存储 量 收取 费用 。 例 如 ， 一 个 主要 的 提供 商用 最 低级 和 最 高 级 性 能 之 间 的 
10 倍 差价 来 宣传 它 的 产品 。 由 于 这 些 性 能 参数 会 导致 价格 的 大 幅 变 化 ， 所 以 服务 水 平 协议 
(SLA ) 能 够 确保 购买 者 得 到 物 有 所 值 的 产品 。SLA 说 明 当 性 能 参数 得 不 到 满足 时 ， 对 云 存 储 提 
供 商 的 具体 罚款 。 这 些 参 数 通常 包括 如 下 内 容 : 
。 可 用 性 一 一 通常 基于 在 服务 月 中 每 天 24 小 时 内 正常 运行 时 间 的 百分比 来 表示 。 这 一 类 
还 包括 灾后 恢复 的 考虑 因素 ， 比 如 一 年 中 灾难 发 生 的 次 数 和 恢复 全 性 能 服务 所 需 的 
时 间 。 

。 可 靠 性 一 一 关注 在 一 个 服务 月 中 读 写 错误 的 次 数 。 

。 响应 性 一 一 通常 以 每 个 业务 的 平均 秒 数 来 衡量 。 这 个 指标 也 可 以 作为 高 峰 和 非 高 峰 时 
段 的 响应 时 间 。 

。 可 管理 性 一 一 决定 这 个 服务 的 消费 者 可 以 在 多 大 程度 上 控制 存储 元 素 的 配置 和 分 配 。 
了 解 扩展 或 收缩 存储 器 使 用 量 有 多 困难 。 

。 安全 一 一 说 明 云 提供 商 和 消费 者 实现 的 控制 类 型 。SLA 可 以 包括 破坏 数据 的 处 罚 ; 然 
而 ， 他 们 很 少 支 付 违约 的 实际 成 本 。 

在 比较 云 存储 提供 商 时 ， 必 须 确定 总 的 拥有 成 本 。 供 应 商 的 费用 可 能 不 限于 简单 的 每 GB 
的 存储 成 本 。 可 以 对 每 个 月 的 0 操作 数量 、 消 耗 的 带宽 、 技 术 支 持 服务 以 及 将 数据 迁移 到 提 
供 商 的 云 中 所 产生 的 “转换 费 ” 进 行 单独 的 费用 评估 。 

几乎 每 一 个 主要 的 技术 公司 都 有 某 种 形式 的 企业 云 存储 服务 。 到 2013 年 底 ， 云 存储 领域 
的 领导 者 是 亚马逊 的 简单 存储 服务 (S3 ) 、 谷 歌 、 惠 普 和 微软 。 即 使 是 最 高 水 平 的 存储 服务 ， 
这 些 公 司 的 收费 价格 也 只 是 数据 存储 设施 总 成 本 的 一 小 部 分 。 因 此 ， 对 于 那些 需要 不 断 减 少 成 
本 持续 压力 的 CIO 来 说 ， 这 个 价格 非常 诱 人 。 

与 任何 事物 一 样 ， 数 据 迁 移 到 云 存 储 也 缺点 。 最 大 的 问题 是 ， 在 云 中 存储 企业 的 关键 数据 
充满 了 风险 。 首 先 ， 存 在 可 用 性 风险 。 把 数据 基础 设施 的 控制 移交 给 外 部 公司 意味 着 要 签订 包 
括 必 须 监 控 和 强制 执行 的 SLA 合同 。 然 后 ， 就 是 外 部 公司 破产 的 风险 。 所 有 涉及 安全 的 最 大 障 
碍 是 : 云 根本 不 可 能 提供 与 一 个 设置 了 安全 防护 的 、 由 企业 控制 的 数据 中 心 所 具有 的 相同 的 安 
全 性 。 各 种 政府 和 金融 法 规 的 障碍 (如 HIPAA 和 Sarbanes- Oxley) ， 也 是 难以 对 付 的 。 当 然 ， 公 
司 将 会 使 用 云 存 储 ， 但 在 可 预见 的 未 来 可 能 会 在 小 的 方面 使 用 云 存 储 。 


本 章 小 结 
本 章 概述 了 一 些 适 用 于 大 型 和 小 型 系统 的 流行 的 0 体系 结构 。SCSI-2、ATA、SATA、EIDE、PCI、 


USB 和 IEEE 1394 都 适用 于 小 型 系统 。 光 纤 通 道 和 一 些 SAM-3 协议 是 为 大 型 、 高 容量 系统 设计 的 。SCSI 
架构 模型 3 定义 了 许多 高 速 接口 。SCSI 架构 模型 3 的 某 些 方面 覆盖 到 数据 通信 的 某 些 领域 ， 因 为 计算 机 
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和 存储 系统 之 间 的 联系 变 得 更 加 紧密 了 。 为 了 便于 参考 ， 在 本 章 中 给 出 了 所 讨论 的 存储 互 连 的 总 结 ， 见 
表 13-5。 


表 13-5 各 种 1/0 接口 的 总 结 
! EE pe 












































设备 之 间 最 大 的 线 缆 长 度 数据 传输 
ATA 0.9m 133MB/s 
由 :50m( 165ft 25MB/s 
Boab 0 et 100MB/s Le 
IEEE 1394 4. 5m( 15ft) 480MB/s 63 
SCSI 12m 320MB/s 16 
串 行 ATA lm(3ft) | 300MB/s 15 
串 行 SCSI 6m( 18ft) 下 300MB/s i 256( 带 扩展 器 ) 
相 : 20m( 66ft 
SSA 2 E a 40MB/s 129 
USB 3. 1 5m( 16. 5ft) | 10GB/s 127 








光纤 通道 是 最 快 的 接口 协议 之 一 ,而且 是 部 署 服务 器 群 组 的 首选 。 然 而 ,包括 iSCSI 和 SATA 在 内 的 
其 他 一 些 协议 正在 显露 出 优势 。 可 以 肯定 的 是 ， 工 业界 正在 用 串 行 接口 取代 并 行 接口 。 对 速度 的 需求 、 
对 于 带 有 许多 物理 互 连 方法 的 串 行 协议 的 通用 兼容 性 以 及 (就 SATA 而 言 ) 需 要 控制 CPU 机 箱 内 部 的 温度 
等 驱动 着 这 种 变化 。 

围绕 “管理 存储 ”和 “存储 服务 ”的 概念 ， 一 个 新 的 行业 正在 出 现 ， 即 第 三 方 负责 为 客户 公司 提供 
短期 和 长 期 的 磁盘 存储 管理 。 人 们 可 以 预期 ， 外 包 服 务 的 这 个 领域 将 会 继续 增长 ， 它 会 带 来 许多 新 的 想 
法 、 协 议和 包括 可 信 云 存储 的 架构 。 


扩展 阅读 


由 于 SCSI 已 经 存在 了 很 长 的 时 间 ， 所 以 它 是 众多 书籍 的 主题 ， 包 括 Schmidt (1999 ) ，Field 和 Ridge 
(1999 ) 编写 的 一 些 书 籍 。Field 与 Ridge 编写 的 关于 SCSI 的 书 可 读 性 很 强 。Spalding(2003 ) 写 的 关于 SAN 
和 NAS 系统 的 介绍 非常 好 。 在 Tate 等 人 (2005 ) 的 书 中 有 关于 特定 产品 的 很 好 的 介绍 和 详细 信息 ， 这 将 提 
高 你 对 该 技术 的 理解 。 由 Clark(1999) 和 Thornburgh(1999) 写 的 书 对 光纤 通道 SAN 进行 了 非常 好 的 介绍 。 
在 Abadi(2009) 和 Buyya(2009) 的 文章 中 可 以 找到 对 云 存储 没有 炒作 的 介绍 。Goldner( 2003 ) 的 书 提供 了 
iSCSI 的 简明 讨论 。iSCSI 的 技术 细节 可 以 在 因特网 RFC 3720 ( www. ietf. org) 中 找到 。Reidel 和 Goldner 
(2003 ) 的 书 很 好 地 说 明了 SCSI 架构 模型 3。 大 量 存储 器 和 接口 信息 可 以 在 信息 技术 标准 国际 委员 会 
(INCITS ) 网 站 上 找到 : INCITS T10 工作 组 (www.tl0. org) 是 SCSI 监督 组 ，T11 (www. tl1. org) 涉 及 光纤 
通道 和 HiPPI，T13 ( www. t13. org) 与 ATA 有 关 。 技 术 信 息 的 其 他 来 源 包 括 SCSI 行业 协会 
(www. scsita. org) 、USB 开发 者 论坛 (www. usb. org) 、 存 储 网 络 行业 协会 (www. snia. org ) 和 串 行 ATA 国 
际 组 织 ( www. serialata. org) 。 存 储 新 闻 的 好 网 站 包括 www. byteandswitch. com 、www. wwpi. com( 计算 机 技 
术 综 述 ) 和 www. storagemagazine. techtarget. com. 

Axelson 出 版 了 关于 USB 接口 主题 的 一 系列 详细 的 书 。 在 这 套 系列 书 中 ， 她 的 《USB Complete》( 2009) 
是 理想 的 起 点 。 这 本 书 对 USB 架构 和 协议 进行 了 清晰 透彻 的 描述 。 为 了 帮助 读者 理解 ， 它 提供 了 与 各 种 
类 型 USB 设备 接口 的 代码 示例 。 在 USB 官方 网 站 www. usb. org 上 也 可 以 找到 丰富 的 信息 。 

作为 研究 生 教材 ，Hill 等 人 (2013 ) 在 他 们 的 《 云 计算 指南 》 一 书 中 简洁 地 描述 了 云 架构 ， 包 括 主要 供 
应 商 的 许多 例子 。 其 讨论 的 云 数 据 架 构 不 同 于 传统 架构 的 方式 ， 这 是 非常 好 的 。 作 者 介绍 了 与 云 存储 有 
关 的 各 种 权衡 ， 这 些 尤 其 值得 注意 。 从 业者 可 能 会 发 现 Er 等 人 (2013 ) 的 书 很 有 用 ， 它 专注 于 商业 问题 ， 
包括 交付 模型 、 治 理 和 云 经 济 学 。 在 类 似 的 工作 中 ，Schultz(2011 ) 的 书 在 存储 层次 结构 以 及 计算 服务 层 
次 结构 的 背景 中 描述 了 云 存 储 。IEEE 有 一 个 教育 云 计 算 门 户 网 站 : www. cloudcomputing. ieee. org。 
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复习 题 

1. 缩写 SCSI 代表 什么 含义 ? 这 个 名 字 现 在 还 有 意义 吗 ? 
2. SAM-3 与 经 典 并 行 SCSI 有 何不 同 ? 

3. IEEE 1394 的 另 一 个 名 称 是 什么 ? 

4. IEEE 1394 改进 了 SCSI-2 的 什么 不 足 ? 

S. 定义 NAS。 

6. 定义 SAN。 请 说 出 SAN 与 NAS 有 何不 同 。 
7. 在 什么 情况 下 你 会 考虑 安装 光纤 通道 SAN? 
8. iSCSI 的 优点 和 缺点 是 什么 ? 

9. ATA 是 什么 ? SATA 在 哪些 方面 有 了 改进 ? 
10. USB 的 哪 两 个 特性 使 它 更 适合 于 便携 设备 ? 


习题 

1. 在 大 型 数据 中 心 或 服务 器 群 组 中 会 找到 本 章 中 讨论 的 哪 种 存储 架构 类 型 ? 在 数据 中 心 环境 中 使 用 其 他 
架构 的 问题 是 什么 ? 

2. 仲裁 阶段 完成 后 有 多 少 台 SCSI 设备 可 以 被 激活 ? 

3. 假设 在 一 个 异步 并 行 SCSI 数据 传输 过 程 中 ， 有 人 从 传输 指定 的 目标 驱动 器 中 取出 了 软盘 。 在 以 下 阶段 
中 发 起 者 如 何 知道 已 经 发 生 了 错误 ? 
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*5. 


总 线 空闲 

选择 

命令 

数据 

状态 

消息 

。 重 选 

a) 如 果 数 据 传输 是 “ 写 ” 操 作 ， 那 么 在 哪 一 个 阶段 中 可 能 会 把 好 的 数据 写 到 软盘 中 呢 ? 

b) 如 果 传 输 的 是 读 操作 ， 那 么 这 个 系统 缓冲 区 中 在 哪个 点 会 有 好 的 数据 ?系统 会 确认 这 些 数 据 吗 ? 


.经理 已 经 决定 你 的 文件 服务 器 的 吞吐 量 可 以 用 Fast- Wide SCSI-3 适配器 替换 旧 的 SCSI-2 主机 适配器 来 


改善 性 能 。 她 也 决定 用 比 旧 的 SCSI-2 驱动 器 大 得 多 的 Fast- Wide SCSI-3 驱动 器 替换 旧 的 SCSI-2 驱动 
器 。 当 把 所 有 文件 从 旧 的 SCSI-2 磁盘 移 到 SCSI-3 驱动 器 之 后 ， 你 重新 格式 化 旧 驱 动 器 ， 以 便 能 够 重 
新 用 于 其 他 地 方 。 当 经 理 听 到 你 这 样 做 时 ， 告 诉 你 把 旧 的 SCSI-2 驱动 器 留 在 服务 器 中 ， 因 为 她 知道 
SCSI-2 与 SCSI-3 向 下 兼容 。 作 为 一 个 好 员工 ， 你 默认 了 这 个 要 求 。 

但 是 ， 几 天 以 后 ， 当 经 理 对 SCSI-3 进行 升级 时 ， 对 似乎 没有 达到 预期 的 性 能 改善 而 表示 失望 ， 你 并 不 
感到 惊讶 。 发 生 了 什么 事情 ?” 你 怎么 能 修好 它 ? 

你 已 经 把 你 的 系统 升级 到 Fast- Wide SCSI 接口 。 这 个 系统 有 1 个 软盘 驱动 器 、1 个 CD-ROM 和 5 个 
8GB 固定 磁盘 。 主 机 适配器 的 设备 编号 是 什么 ”为 什么 ? 


。SCSI-2 与 SCSI 架构 模型 3 背后 的 原则 有 什么 不 同 ? 


7. SCSI 架构 模型 3 给 计算 机 和 外 围 设备 制造 商 提供 了 什么 好 处 ? 
8. 假设 你 希望 通过 把 一 些 计算 机 和 摄像 机 连接 在 一 起 以 设计 一 个 视频 会 议 系统 。 你 将 选择 哪 种 接口 模 


10. 


11. 


12. 


式 ? 用 于 传输 视频 的 协议 包 与 用 于 传输 数据 的 协议 包 相 同 吗 ? 什么 协议 信息 将 在 一 个 包 内 ， 而 不 在 其 
他 包 内 ? 


. SSA 总 线 配 置 如 何 恢复 单个 磁盘 故障 ? 假设 在 第 一 个 故障 节点 修复 好 之 前 另 一 个 节点 又 有 故障 了 。 系 


统 将 如 何 恢复 ? 

假设 你 被 分 配 到 一 个 工作 组 ， 这 个 工作 组 已 经 接受 了 在 化 工厂 安置 自动 控制 的 任务 。 几 百 个 传感器 
将 放置 在 广 区 内 的 镀 、 桶 和 加 料 斗 中 。 传 感 器 检测 到 的 所 有 数据 将 送 到 一 组 性 能 足够 高 的 计算 机 中 ， 
以 便 工厂 经 理 和 主管 能 够 控制 和 监视 发 生 的 各 种 过 程 。 

在 传感器 和 计算 机 之 间 你 将 使 用 什么 类 型 的 接口 ? 如 果 所 有 计算 机 都 能 访问 所 有 的 传感器 输入 ， 那 
么 你 会 使 用 相同 类 型 的 连接 方式 进行 计算 机 之 间 的 互 连 吗 ? 你 将 使 用 哪 种 VO 控制 模式 ? 

为 你 工作 的 一 个 工程 师 建 议 改 变 公 司 生产 系统 的 总 线 架 构 。 她 说 如 果 总 线 修改 为 直接 支持 网 络 协议 ， 
那么 系统 就 不 需要 网 卡 了 。 她 还 说 你 也 可 以 淘汰 SAN， 把 客户 端 计算 机 直接 连接 到 磁盘 阵列 。 你 反 
对 这 种 做 法 吗 ? 请 说 明理 由 。 提 示 : 主 总 线 除了 支持 存储 设备 读 写 外 ， 还 要 考虑 主 总 线 的 其 他 用 途 。 
存储 系统 越 来 越 依赖 于 作为 传输 介质 的 因特网 基础 设施 。 这 种 方法 的 优点 是 什么 ? 在 安全 性 和 可 靠 
性 方面 存在 哪些 问题 ? 
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A. 1 引言 


在 本 书 中 ， 我 们 理所当然 地 认为 读者 已 经 了 解 了 计算 机 数据 结构 的 基本 知识 。 若 想 全 面 理 
解 本 书 并 不 一 定 需要 了 解数 据 结 构 的 基本 知识 ， 但 是 了 解数 据 结构 的 基本 知识 有 助 于 掌握 计算 
机 组 织 与 体系 结构 中 的 一 些 更 细微 之 处 。 本 附录 的 目的 是 给 那些 还 没有 正式 学 习 过 数据 结构 的 
读者 提供 扩展 词汇 。 本 附录 也 可 以 作为 那些 很 久 以 前 学 过 数据 结构 的 读者 的 一 次 复习 。 为 了 这 
个 目标 ， 在 这 里 我 们 只 能 简短 地 介绍 ， 而 且 ( 当 然 !) 倾向 于 硬件 考虑 。 和 希望 深入 研究 的 读者 ， 
请 阅读 本 附录 后 面 列 出 的 参考 文献 。 本 附录 中 所 有 例子 的 存储 器 地 址 都 是 以 十 六 进 制 给 出 的 。 
如 果 你 还 不 了 解 十 六 进 制 ， 应 该 先 去 阅读 第 2 章 。 


A.2 基本 结构 
A.2.1 数组 


术语 数据 结构 指 的 是 相关 信息 片段 的 组 织 方式 ， 以 便 在 执行 过 程 中 根据 需要 能 够 很 容易 地 访问 
数据 。 数 据 结构 通常 独立 于 它们 的 实现 ， 因 为 这 种 组 织 方式 是 逻辑 上 的 ， 而 不 一 定 是 物理 上 的 。 

最 简单 的 数据 结构 是 线性 数组 。 从 编程 经 验 中 你 可 能 已 经 了 解 到 ， 一 个 线性 数组 是 计算 机 
存储 器 的 一 个 连续 区 域 ， 并 且 程 序 已 经 给 这 个 区 域 分 配 了 一 个 名 字 。 在 这 个 连续 区 域 中 存储 的 
实体 组 必须 是 同 构 的 (它们 必须 有 相同 的 大 小 和 类 型 ) 并 且 能 够 单独 寻 址 ， 通 常 使 用 下 标 寻 址 。 
例如 ,假设 你 有 如 下 的 Java 声明 : 


char[] charArray{[10]; 


操作 系统 给 变量 charArray 分 配 一 个 存储 值 以 表示 这 个 数组 的 基地 址 (或 开始 地 址 ) 。 通 过 这 
个 基地 址 位 置 开始 的 偏 移 提供 对 后 续 字 符 的 访问 。 偏 移 量 的 增加 值 由 这 个 数组 的 原始 数据 类 型 
的 大 小 决定 ， 在 这 个 例子 中 ， 原 始 数 据 类 型 是 char。 在 Java 中 ,字符 是 16 位 宽 ， 所 以 一 个 字 
符 数组 的 偏 移 量 应 该 是 每 个 数组 元 素 2 字 节 。 例 如 ， 比 方 说 ，charArray 结构 存储 在 地 址 
80A2 中 。 程 序 的 语句 : 


char aChar = charArray [3] ; 


在 存储 器 位 置 80A8 可 找到 要 检索 的 2 字 节 。 因 为 Java 索引 数组 是 从 0 开始 的 ， 所 以 我 们 在 字 
符 变量 achar 中 存储 的 是 这 个 数组 的 第 四 个 元 素 : 
80A2 + < x 3 从 基地 址 开始 的 字符 仿 移 量 = 80A2 + 6 = 80A8 
因为 二 维 数组 是 由 一 维 数组 组 成 的 线性 数组 ， 所 以 存储 器 偏 移 值 必须 考虑 行 的 大 小 ， 以 及 
数据 中 原始 数据 类 型 的 大 小 。 例 如 ， 考 虑 下 面 的 Java 声明 


char [] charArray [4] [10] ; 


这 里 我 们 正在 定义 4 个 线性 数组 ， 每 个 线性 数组 有 10 个 存储 人 位置。 然而， 作为 一 个 有 4 行 10 
列 的 二 维 数组 来 考虑 这 个 结构 会 容易 得 多 。 如 果 charArray 的 基地 址 仍然 是 80A2 ， 那 么 应 该 
在 地 址 80BE 中 可 找到 元 素 charArray [1] [4]。 这 是 因为 数组 的 0 行使 用 地 址 80A2 ~ 80B5， 
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1 行 从 80B6 开始 ， 并 且 我 们 访问 第 2 行 的 第 5 个 元 素 : 
2 x4 从 基地 址 开始 的 字符 偏 移 量 = 80B6 + 8 = 8OBE 
当 程序 解决 的 问题 可 以 导向 数组 存储 位 置 的 一 个 小 子 集 时 ， 数 组 存储 便 是 一 种 好 的 选择 。 当 我 
们 在 一 个 写 西洋 双 陆 棋 游 戏 时 ， 情 况 就 是 这 样 。 例 如 ， 每 个 "点 "将 是 “棋盘 "数组 中 的 一 个 位 置 。 
这 个 程序 只 检查 那些 合法 移动 的 棋盘 点 ， 它 们 在 移动 前 由 假 子 的 一 次 特定 滚动 来 确定 移动 步 数 。 
数组 另 一 个 好 的 应 用 是 基于 每 天 的 时 间或 每 月 的 天 数 进行 数据 收集 任务 。 例 如 ， 我 们 可 以 
计算 某 天 不 同时 间 高 速 公路 上 通过 一 个 特定 点 的 车 辆 数量 。 如 果 有 人 问 在 9: 00 ~9: 59 之 间 
的 平均 车 流量 ， 我 们 所 要 做 的 是 ， 在 已 经 收集 到 数据 的 中 ， 计 算 每 个 24 小 时 数组 中 第 10 个 元 
素 的 平均 值 。( 半夜 1 点 是 第 0 个 元 素 。) 


A.2.2 队列 和 链表 


当 我 们 所 处 理事 项 是 响应 服务 请 求 时 ， 数 组 不 是 非常 有 帮助 的 。 服 务 请 求 通常 按照 所 请 求 
的 时 间 来 处 理 。 换 句 话 说， 就 是 先 到 先 服务 。 

考虑 一 个 网 络 服务 ， 它 处 理 通过 因特网 连接 的 用 户 的 超 文本 传输 协议 (HTTP ) 请 求 。 进 来 
的 请 求 顺序 可 能 与 表 A-2 所 示 的 类 似 。 

我 们 可 以 把 这 些 请 求 中 的 每 一 个 放 入 一 个 数组 ， 当 我 们 准备 为 下 一 个 请 求 服务 时 查找 这 个 
数组 中 最 小 的 时 间 戳 值 。 然 而 ， 这 种 实现 的 效率 极其 低下 ， 因 为 数组 中 每 个 元 素 每 次 都 需要 被 
查询 。 再 者 ， 如 果 我 们 经 历 流 量 异常 大 的 一 天 ， 我们 将 会 冒 数 组 空间 耗 尽 的 风险 。 由 于 这 些 原 
因 ， 对 于 先 到 先 服务 应 用 ， 队 列 是 合适 的 数据 结构 。 队 列 数据 结构 要 求 以 元 素 进入 时 的 顺序 删 
除 元 素 。 在 银行 和 超市 排队 等 候 是 队列 的 很 好 的 例子 。 

有 不 同 的 方法 可 以 实现 队列 ， 但 是 所 有 队列 的 实现 都 分 为 4 个 部 分 : 一 个 指向 队列 第 一 项 
(队列 头 ) 的 存储 器 变量 、 一 个 指向 队列 结尾 (队列 尾 ) 的 存储 器 变量 、 存 储 队列 项 的 存储 器 位 
置 和 一 组 对 队列 数据 结构 的 具体 操作 。 指 向 队列 头 的 指针 指示 了 下 一 个 服务 的 项 目 。 对 于 把 项 
加 到 队 尾 时 尾 指 针 是 有 用 的 。 当 头 指针 是 空 ( 零 ) 时 ， 队 列 是 空 的 。 在 队列 上 的 操作 通常 包括 
添加 一 个 记录 到 列表 的 尾部 (入 队 ) 、 从 表 的 开始 删除 一 个 记录 (离队 ) 和 检查 队列 是 否 为 空 。 


_ 表 A-1 一 个 网 络 服务 的 HTTP 请 求 





80B6 + 









10. 122. 224. 5 http :和 www. spiffywebsite. com/ sitemap. html 
07: 22: 04 | 10.167.14.190 | hittp /Www, Sitywebaite com/shoppingeart: bl 
07: 22;. 12 | 10.148.10567 | Http s/www. spiffywebaite, com/spiftypix. jpg 
10. 72. 99. 56 




















http :和 www. spiffywebsite. com/ userguide. html 


一 种 流行 的 实现 队列 的 方法 是 使 用 链表 。 在 一 个 链表 中 ， 队 列 中 的 每 个 项 目 都 包含 一 个 指 
向 队列 下 一 项 的 指针 。 当 项 目 离队 时 ， 头 指针 可 以 从 刚刚 删 掉 的 节点 中 找到 的 信息 以 定位 到 下 
一 个 节点 。 所 以 ， 在 上 面 的 网 络 服务 例子 中 ,项 目 1 服务 之 后 (并 且 从 队列 中 删除 了 ) ， 队 列 的 
头 指针 被 设置 为 指向 项 目 2。 

在 表 A- 1 的 例子 中 ,假设 队 列 头 的 地 址 是 7049， 它 包含 第 一 个 HITP 请 求 ， 即 
www. spiffywebsite. com/sitemap. html。 队 列 的 头 指针 设置 为 7049。 在 存储 器 地 址 7049 中 ， 我 们 
将 有 记录 : 

07: 22: 03, 10. 122. 224.5, www. spiffywebsite. com/ sitemap. html, 70E6, 

其 中 70E6 是 随后 项 目的 地 址 : 
07: 22. 04, 10. 167. 14. 190 ，www. spiffywebsite. com/ shoppingcart. html ，712A。 
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这 个 队列 的 全 部 内 容 如 表 A-2 所 示 。 
表 A2 在 存储 器 中 一 个 HTTP 请 求 队列 的 实现 










http:/www. spiffywebsite. com/ sitemap. html 








: 22: 04 |10.167.14.190| http:/www. spiffywebsite. com/ shoppingcart. html 712A 











: 22: 12 | 10. 148. 105. 67 | http:/www. spiffywebsite. com/spiffypix. jpg 81B3 














10. 72. 99. 56 





http: /www. spiffywebsite. com/ userguide. html 





队列 头 的 指针 被 设置 为 7049， 并且 尾 指 针 被 设置 为 81B3。 如 果 男 一 个 用 户 请 求 到 达 ， 那 
么 系统 在 存储 器 中 会 找到 一 个 位 置 ， 并 更 新 最 后 的 队列 项 (指向 新 的 记录 ) 以 及 尾 指针 。 应 该 
注意 ， 当 使 用 这 类 指针 结构 时 ， 不 像 数 组 ， 它 不 要 求 数据 元 素 在 存储 器 中 是 连续 的 。 这 就 是 为 
什么 这 种 结构 在 需要 时 能 够 增长 。 此 外 ， 也 不 要 求 地 址 是 升序 的 ， 正 如 我 们 已 经 展示 的 。 队 列 
元 素 能 够 定位 到 存储 器 中 的 任何 位 置 。 指 针 维 持 了 队列 的 顺序 。 

我 们 已 经 描述 的 队列 体系 结构 能 够 进行 修改 以 创建 一 个 固定 大 小 的 队列 (通常 称 为 环形 队 
列 ) ， 或 者 一 个 优先 级 队列 ， 其 中 某 些 类 型 的 记录 将 跳 过 其 他 前 面 的 记录 。 即 使 添加 了 这 些 特 
征 ， 队 列 还 是 很 容易 实现 数据 结构 。 


A. 2.3 堆栈 


由 于 明显 的 原因 ， 队 列 有 时 称 为 FIFO( 先进 先 出 ) 列表。 一 些 应 用 要 求 相 反 的 顺序 ， 即 后 
进 先 出 (LIFO) 。 堆 栈 是 适合 LIFO 顺序 的 数据 结构 。 从 自助 餐厅 给 顾客 提供 盘子 的 相似 之 处 得 
到 它们 的 名 字 。 自 助 餐厅 服务 人 员 把 热 的 、 湿 的 、 干 净 的 盘子 加 到 弹簧 管子 的 项 部， 将 冷 的 、 
干 的 盘子 压 向 管子 的 下 面 。 下 一 位 顾客 从 顶部 取 一 个 盘子 。 这 个 顺序 如 图 A-1 所 示 。 
图 A-1a 展示 了 一 个 盘子 堆栈 。1 号 盘子 是 放 到 堆栈 上 的 第 一 个 盘子 。7 号 盘子 是 放 到 堆栈 上 的 
最 后 一 个 盘子 。7 号 盘子 是 第 一 个 被 拿 走 的 ， 如 图 A-lb 所 示 。 当 8 号 盘子 到 达 时 ， 它 将 放 到 堆 
栈 顶 部 ， 如 图 A-1c 所 示 。 加 一 个 项 目 到 堆栈 的 动作 称 为 压 栈 。 删 除 一 个 项 目 是 弹出 。 询 问 堆 
栈 顶 部 的 项 而 不 删除 它 ， 是 查看 它 。 





b ) 拿 走 7 号 盘子 (弹出 ) c ) 添加 8 号 盘子 〈 压 栈 ) 
图 A-1 盘子 堆栈 


当 你 在 一 个 程序 中 使 用 一 系列 带 有 府 套 的 子 程序 调用 时 ， 堆 栈 是 一 种 有 用 的 数据 结构 。 如 
果 在 转移 到 下 一 个 地 址 之 前 把 当前 地 址 压 人 堆栈 的 项 部， 那么 你 知道 能 够 沿 着 相同 的 路 径 返 
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。 你 所 要 做 的 就 是 当 需 要 时 弹出 每 个 地 址 。 就 像 日 常生 活 中 的 一 个 例子 ， 比 如 我 们 按照 这 个 
nn 
1. 纽约 (New York) NY 
. 奥 尔 巴 尼 (Albany) ，NY 
. 布 法 罗 (Buffalo) ，NY 
. 伊利 (Erie) ，PA 
. 匹 效 堡 (Pittsburgh) ，PA 
. 克利夫兰 ( Cleveland) ，OH 
. 圣路易斯 (St. Louis) ，MO 
. 芝加哥 ( Chicago),， IL 
从 芝加哥 我 们 怎么 回 到 纽约 ? 一 个 人 会 简单 地 拿 出 地 图 ( 找 。 。 表 A.3 访问 城市 的 堆 术 
到 一 条 更 直接 的 路 线 ) ,或 者 只 是 “知道 ” 找 80 号 州 际 公路 ”二 证 
和 公路 的 东 头 。 计 算 机 肯定 不 如 我 们 聪明 ， 所 以 计算 机 要 做 一枝 T pp 


~] OW ww Dh 


Oo 

















的 最 简单 的 是 折 回 原来 的 路 线 。 一 个 堆栈 (如 表 A-3 中 所 

示 ) 对 于 这 项 工作 是 完全 正确 的 数据 结构 。 计 算 机 需要 做 的 ee 

是 把 所 走 过 路 径 的 当前 位 置 压 和 堆栈 顶部 。 从 堆栈 顶部 弹出 4 |] 人 和 

以 前 的 城市 ， 这 样 返回 的 路 就 很 容易 找到 。 3 市 
实现 堆栈 可 能 有 很 多 种 方法 。 最 流行 的 软件 实现 是 通过 奥 尔 加 尼 








线性 数组 和 链表 。 系 统 堆栈 (硬件 版 本 ) 是 使 用 固定 存储 器 分 1 纽约 


配 来 实现 的 ， 这 是 一 个 为 堆栈 单独 使 用 留 出 的 存储 器 块 。 管 
理 堆 栈 需 要 两 个 存储 器 变量 ， 一 个 变量 指向 堆栈 顶部 ( 放 和 人 堆栈 的 最 后 一 项 ) ， 而 第 二 个 变量 保存 
堆栈 中 项 目的 数量 。 最 大 堆栈 的 大 小 (或 最 高 允许 内 存 地 址 ) 作 为 常量 存储 。 当 一 个 项 目 压 人 堆栈 
时 ， 堆 栈 指针 (堆栈 顶部 的 存储 器 地 址 ) 会 增加 ， 增 加 量 是 存储 在 堆栈 中 的 数据 类 型 的 大 小 。 

考虑 一 个 例子 ， 我 们 想 保 存 字 母 表 中 的 最 后 三 个 字母 ， 并 按照 相反 的 顺序 检索 它们 。 这 些 
字符 的 用 十 六 进 制 表 示 的 Java 代码 (Unicode) 是 : 

XX =0058Y ='0059-Z = 005A 

为 堆栈 预 留 的 存储 器 地 址 是 808A ~ 80CA。 常 量 MAXSTACK 设置 为 20( 十 六 进 制 )。 因 为 堆栈 初 
始 时 是 空 的 ， 所 以 堆栈 指针 被 设置 为 一 个 空 值 ， 而 且 堆 栈 计数 器 也 是 0。 表 A-4 展示 了 要 存储 
3 个 Unicode 字符 时 ， 堆 栈 和 管理 变量 的 踪迹 。 


表 A-4 和 Y sn <( 庶 线 表示 不 相关 的 存储 器 值 ) 






























































栈 项 =808A 栈 项 =808C 栈 顶 =808E 


a) 添加 X(0058) 且 堆栈 指针 b) 添加 Y(0059) 且 堆栈 指针 c) 添加 Z(005A) 
增加 数据 元 素 的 大 小 (2 再 次 增加 2 字 节 


字 
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要 检索 这 些 数据 ， 会 有 三 次 堆栈 弹出 。 每 一 次 弹出 ， 堆 栈 指 针 会 减少 2。 当 然 ， 每 次 添加 
和 检索 时 ， 必 须 检 查 堆 栈 状态 。 我 们 必须 保证 不 能 向 已 满 的 堆栈 中 添加 项 目 ， 或 者 试图 从 空 堆 
栈 中 移 除 项 目 。 堆 栈 已 广泛 应 用 于 计算 机 系统 固件 和 软件 中 。 


A.3 树 

队列 、 堆 栈 和 数组 对 于 处 理 列表 中 的 项 是 很 有 用 的 ， 这些 项 在 表 中 的 位 置 没有 变化 (相对 
于 彼此 ) ， 并 且 不 管 列 表 中 有 多 少 项 。 当 然 ， 这 不 是 我 们 日 常生 活 中 遇 到 的 许多 数据 集 的 类 型 。 
考虑 一 个 管理 地 址 憩 的 程序 。 一 种 对 这 些 数据 排序 有 用 的 方法 是 按照 姓氏 顺序 。 折 半 查 找 能 快 
速 定位 表 中 的 任何 姓氏 ， 可 以 将 搜索 限制 在 列表 的 一 半 。 在 著名 数学 家 列表 中 用 折 半 查找 搜索 
名 字 Kleene 的 过 程 如 图 A-2 所 示 。 我 们 从 确定 列表 的 中 间 项 ( Hilbert) 开始， 并 且 与 键 值 进 行 比 
较 。 如 果 相 等 ， 则 找到 了 期 望 的 项 。 如 果 键 值 (Kleene) 大 于 列表 的 中 间 项 ， 那 么 我 们 就 到 列表 
的 下 半 部 分 寻找 ， 如 图 A-2b 所 示 。( 这 样 有 效 地 减少 了 一 半 的 搜索 空间 。) 现在 我 们 确定 列表 
下 半 部 分 的 新 的 中 间 项 (Markov) 。 如 果 键 值 (Kleene) 小 于 这 个 新 的 中 间 项 ， 那 么 我 们 扔 掉 这 个 
表 的 下 半 部 分 ， 保 留 上 半 部 分 ， 如 图 A-2e 所 示 。 如 果 键 值 仍然 没有 找到 ， 那 么 我 们 再 把 表 分 
为 两 半 。 这 样 ， 依 次 将 列表 划分 成 两 半 ， 直 到 找到 键 值 ( 或 者 确定 键 值 不 在 列表 中 ) 。 这 个 例 
子 人 为 地 展示 了 最 坏 的 情况 。 在 有 16 个 项 目的 表 中 ， 它 用 了 4 次 操作 定位 一 个 键 值 。 如 果 查 
找 Hilbert， 则 我 们 在 第 一 次 尝试 时 就 已 经 找到 了 。 无 论 这 个 表 多 大 ， 定 位 任何 名 字 所 用 时 间 与 
以 2 为 底 的 列表 项 目 数 的 对 数 成 比例 。 


Boole Boole Boole Boole 
Erdos Erdos Erdos Erdos 
Euclid | Euclid Euclid 
Euler Euler Euler Euler 
Fermat Fermat Fermat Fermat 
Gauss Gauss Gauss Gauss 
Godel Godel Godel Godel 
Hilbert Hilbert Hilbert Hilbert 
Hopper Hopper Hopper Hopper 
Kleene Kleene Kleene Kleene 
Klein Klein Klein Klein 
Markov Markov Markov Markov 
Newton Newton Newton Newton 
Post Post Post Post 
Riemann Riemann Riemann Riemann 
Tarski Tarski Tarski Tarski 
a) b) ©) d) 


图 A-2 对 Kleene 的 折 半 查找 


显然 ， 折 半 查 找 要 求 数据 按照 它 的 键 值 排序 。 所 以 ， 当 我 们 想 向 地 址 德 中 添加 一 个 名 字 时 
会 发 生 什 么 呢 ? 我 们 必须 把 它 放 到 合适 的 地 方 ， 以 便 能 够 可 靠 地 使 用 折 半 查找 。 如 果 这 个 地 址 
短 存 储 在 一 个 线性 数组 中 ， 那 么 我 们 能 够 相当 容易 地 计算 出 新 元 素 的 位 置 ， 比 如 位 置 k。 但 是 ， 
为 了 插入 这 个 元 素 ， 我 们 必须 在 这 个 数组 中 为 它 腾 出 空间 。 这 意味 着 必须 首先 把 位 置 上 到 
(这 个 地 址 筹 中 的 最 后 一 项 ) 的 所 有 元 素 依 次 移动 到 位 置 k+1 到 n+1。 如 果 这 个 地 址 簿 很 大 ， 
那么 这 种 转换 过 程 将 可 能 比 我 们 希望 得 要 慢 。 此 外 ， 如 果 数 组 只 能 容纳 个 项 目 ， 那 么 我 们 就 
有 大 麻烦 了 。 不 得 不 定义 一 个 新 的 数组 ， 然 后 从 旧 的 数组 中 加 载 数据 项 ， 这 样 会 耗费 更 多 的 
时 间 。 

链表 实现 也 不 能 很 好 地 工作 ， 因 为 寻找 链表 的 中 间 点 也 是 困难 的 。 查 找 链表 的 唯一 方法 是 
跟着 链表 项 的 链 直 到 找到 新 项 所 在 的 地 方 为 止 。 如 果 你 有 一 长 串 的 列表 ， 那么 线性 搜索 在 操作 
上 是 不 可 行 的 ， 不 会 发 生 令 人 高 兴 的 足够 快速 的 情况 。 

因此 ， 有 序 可 维护 的 列表 是 一 个 很 好 的 数据 结构 ， 它 使 我 们 能 够 快速 地 找到 所 需 项 ， 添 加 
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和 删除 项 目 也 没有 过 多 的 开销 。 有 几 种 数据 结构 符合 这 些 要 求 。 这 些 数据 结构 中 最 简单 的 是 二 
叉 树 。 与 链表 一 样 ， 二 叉 树 使 用 指向 内 存 位 置 的 指针 来 跟踪 相 邻 的 数据 项 。 而 且 ， 像 链表 一 
样 ， 二 又 树 能 够 增长 到 任意 大 。 并 且 这 种 增长 方式 能 够 保证 从 树 上 检索 任何 键 值 都 很 容易 。 二 
又 树 称 为 “二 又 ”的 原因 是 在 它们 的 图 形 表 示 中 ， 每 个 节点 (或 项 点) 最 多 有 两 个 后 代 ( 子 ) 节 点 。 
(超过 两 个 后 代 节点 的 树 称 为 n 叉 树 。) 在 图 A-3 中 展示 了 一 些 二 叉 树 的 例子 。 不 要 为 这 些 看 起 
来 像 倒置 的 树 的 图 烦恼 ， 它 们 是 数学 意义 上 的 树 。 每 个 节点 都 连接 到 这 个 图 (这 意味 着 从 第 一 
个 节点 开始 每 个 节点 都 是 可 达 的 ) ， 并 且 这 个 图 不 包含 环 (这 意味 着 我 们 不 会 在 寻找 东西 的 过 
程 中 兜 圈子 ) 。 
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a) b ) c) 
图 A-3 一 些 二 叉 树 


树 的 最 顶端 节点 是 它 的 根 ， 这 个 根 是 树 中 唯一 不 得 不 独立 跟踪 的 部 分 。 所 有 其 他 节点 的 引 
用 都 是 通过 根 节点 使 用 存储 在 每 个 节点 中 的 两 个 指针 值 实现 的 。 每 个 指针 指示 在 哪儿 可 以 找到 
节点 的 左 子 节点 或 右 子 节点 。 一 个 树 的 叶子 是 结构 中 最 底部 的 节点 ， 指 向 它们 子 节点 的 指针 为 
空 值 。 从 叶子 到 树 根 的 距离 ( 层 数 ) 称 为 它 的 高 。 不 是 叶子 的 节点 称 为 树 的 内 部 节点 。 内 部 节 
点 至 少 有 一 个 子 树 (哪怕 它 是 一 个 叶子 ) 。 

除了 指针 外 ， 二 又 树 的 节点 还 包括 数据 (或 数据 键 值 ) ， 树 围绕 着 这 些 数据 来 构造 。 二 又 
树 通常 组 织 为 所 有 键 值 小 于 存储 在 左 子 树 中 特定 节点 的 键 值 ， 且 所 有 键 值 大 于 或 等 于 存储 在 右 
子 树 中 的 键 值 。 图 A-4 是 这 种 思想 的 一 个 例子 。 

图 A-4 所 示 的 二 义 树 也 是 平衡 二 又 树 。 在 形式 上 ， 当 
二 又 树 平衡 时 ， 每 个 节点 的 左 子 树 和 右 子 树 的 深度 最 多 相 
差 1。 重 要 的 是 ， 定 位 树 所 引用 的 任何 数据 项 的 时 间 与 树 
中 节点 数 以 2 为 底 的 对 数 成 比例 。 所 以 一 个 包含 65 535 个 
数据 键 的 树 ， 找 到 任何 特定 元 素 ( 或 确定 该 元 素 不 在 树 
中 ) 最 多 需要 15 次 存储 器 操作 。 不 像 保存 在 线性 数组 中 的 
有 序 表 ( 每 一 次 搜索 都 有 相同 的 运行 时 间 )， 二 叉 树 中 的 
键 值 更 容易 维护 。 要 插入 一 个 元 素 ， 我 们 所 要 做 的 就 是 重 ”图 人 4 et 
新 安排 几 个 存储 器 指针 ， 而 不 是 重新 组 织 整 个 表 。 从 平衡 
二 又 树 中 插入 和 删除 一 个 节点 的 运行 时 间 也 与 树 项 目 数 的 以 2 为 底 的 对 数 成 比例 。 因 此 ， 这 种 
数据 结构 在 维护 一 组 有 序数 据 元 素 方面 比 数组 或 简单 链表 更 好 。 

虽然 我 们 的 图 容易 使 树 的 逻辑 结构 概念 化 ， 但 是 应 该 记 住 计算 机 存储 器 是 线性 的 ， 所 以 我 
们 的 图 片 仅 是 一 种 抽象 。 在 表 A-5 中 ,我 们 已 经 提供 了 图 A-4 所 示 树 的 一 个 64 字 节 存储 器 的 
映射 。 为 了 便于 阅读 ,我 们 以 表格 的 形式 展示 它们 。 例 如 ,第 1 行 第 5 列 的 字 节 位 置 的 十 六 进 
制 地 址 是 15。 第 0 行 第 0 列 作为 地 址 0。 节 点 键 值 被 编码 为 十 六 进 制 ASCII 码 ， 存 储 映射 上 面 
的 表 所 示 。 






































在 我 们 的 存储 器 映射 中 ， 树 根 位 于 地 址 36 ~38( 第 3 行 的 第 6 ~8 列 )。 它 的 键 值 位 于 地 址 
37。 根 的 左 子 树 (和 孩子) 可 以 在 地 址 25 中 找到 ， 右 子 树 可 以 在 地 址 3B 中 找到 。 如 果 我 们 查看 地 
址 3B8， 则 可 以 找到 键 值 IT， 它 的 左 子 节点 位 于 地 址 14， 它 的 右 子 节点 位 于 地 址 21。 在 地 址 21 
处 ， 我 们 发 现 左 节点 丁 的 两 个 子 指针 为 0。 

二 叉 树 在 许多 应 用 中 都 是 有 用 的 ， 比 如 编译 器 和 汇编 器 (参见 第 8 章 ) 。 然 而 ， 当 它 涉及 从 
非常 大 的 数据 集中 存储 和 检索 键 值 时 ， 多 种 数据 结构 优 于 二 又 树 。 作 为 一 个 例子 ， 考 虑 为 纽约 
市 设计 一 个 在 线 电 话 号 码 敌 的 任务 ,纽约 市 有 超过 800 万 人 口 。 假 设 大 约 有 800 万 电话 号 码 要 
放 到 我 们 的 电话 竹中 ， 我们 最 终 将 会 得 到 至 少 有 23 层 的 二 又 树 。 此 外 ， 一半 以 上 的 节点 将 在 
叶子 上 ， 这 意味 着 在 找到 所 需要 的 数字 之 前 ， 我 们 必须 花费 大 部 分 时 间 读 取 22 个 指针 。 

对 于 这 种 应 用 虽然 二 叉 树 设计 并 不 是 完全 糟糕 的 ， 但 是 我 们 可 以 改进 它 。 一 种 更 好 的 方法 
是 名 为 单词 查找 树 的 一 种 n 又 树 结构 。 单 词 查找 树 不 是 在 每 个 节点 中 保存 整个 键 值 ， 而 是 使 用 
键 的 一 部 分 。 在 沿 着 单词 查找 树 向 下 的 搜索 过 程 中 组 装 键 值 。 内 部 节点 包含 足够 多 的 指针 ; 这 
样 可 以 直接 搜索 到 所 需 的 键 或 单词 查找 树 的 下 一 层 。 单 词 查找 树 特 别 适合 数据 有 可 变 长 键 的 情 
况 ， 比 如 电话 号 码 短 的 例子 。 更 短 的 键 靠近 顶部 ， 而 更 长 的 键 在 数据 结构 的 底部 。 

在 图 A-5 中 ,我 们 描绘 了 一 个 包含 著名 数学 家 名 字 的 单词 查找 树 。 这 个 图 说 明 每 个 内 部 节 
点 包含 26 个 字母 。 图 中 的 数据 性 质 暗示 了 有 比 图 A-5 所 示 更 有 效 的 单词 查找 树 结构 。( 我 们 观 
察 到 ， 很 难 找到 一 个 著名 数学 家 的 名 字 是 以 ZQX 开头 的 。) 事 实 上， 设计 一 个 内 部 节点 结构 是 
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图 A-5 一 个 著名 数学 家 名 字 的 单词 查找 树 
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构造 单词 查找 树 最 困难 的 部 分 。 根 据 键 值 ， 可 以 使 用 一 个 以 上 的 字符 作为 索引 。 例 如 ， 假 设 一 
个 单位 中 并 不 是 包含 字母 表 的 每 个 字母 ， 那 么 我 们 可 以 使 用 字母 组 。 通 过 改变 图 A-5 中 单词 查 
找 树 的 根 节点 中 键 的 多 样 性 ， 单 词 查 找 树 可 以 设计 得 更 平 。 这 种 修改 如 图 A-6 所 示 。 如 果 仔 细 
地 进行 了 扁平 化 ， 那 么 扁平 化 单词 查找 树 的 结果 可 以 使 搜索 更 快 地 完成 。 在 图 A-6 中 ， 我 们 选 
择 只 出 现 ER 和 EU 两 个 键 ， 以 消除 一 层 。 如 果 我 们 已 经 双 倍 了 每 个 键 ， 那 么 根 将 包含 676 个 
键 ( 从 AA ~ ZZ) ， 这 样 数据 结构 与 所 要 保存 的 数据 量 相 比 变 得 非常 大 且 笨 拙 。 
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图 A-6 一 个 更 平 的 著名 数学 家 名 字 的 单词 查找 树 


实际 上 ， 为 了 存储 和 检索 大 量 数据 ， 数 据 结构 的 设计 会 更 多 地 考虑 它们 将 存储 的 介质 而 不 
是 数据 本 身 的 性 质 。 通 常 ， 会 设计 索引 节点 以 便 在 树 的 一 层 上 内 部 节点 中 的 一 些 整数 可 以 通过 
存储 索引 的 磁盘 驱动 器 的 一 次 读 操 作 就 可 以 访问 。 这 样 的 数据 结构 是 一 种 B+ 树 ， 它 用 于 大 型 
数据 库 系统 中 。 

B+ 树 是 由 指向 索引 结构 或 实际 数据 记录 的 指针 组 成 的 一 种 层次 结构 。 当 向 数据 库 中 增加 
记录 和 从 数据 库 中 删除 记录 时 ，B + 树 中 的 叶子 节点 会 更 新 。 当 不 可 能 对 存在 的 叶子 节点 进行 
更 新 时 ， 产 生 额 外 的 分 支 ( 内 部 节点 ) 。B + 树 的 内 部 节点 统称 为 索引 部 分 ， 而 叶子 节点 称 为 序 
列 部 分 ， 因 为 它们 总 是 按 顺序 排列 的 。 图 A-7 是 一 个 B+ 树 的 一 部 分 的 示意 图 . 
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图 A-7 B+ 树 的 一 部 分 


570 附录 A 





图 A-7 所 示 的 数字 是 记录 的 键 值 。 沿 着 B+ 树叶 子 节点 中 的 每 一 个 键 值 ， 数 据 库 管理 系统 
(参见 第 8 章 ) 维 护 一 个 指向 物理 记录 位 置 的 指针 。 操 作 系 统 用 这 个 指针 值 从 磁盘 中 检索 记录 。 
所 以 ， 物 理 记录 几乎 能 够 放 在 任何 位 置 ,但 是 数据 结构 的 顺序 部 分 总 是 按 顺 序 保存 的 。 对 B + 
树 的 遍历 保证 了 我 们 可 以 根据 键 值 快速 定位 任何 记录 。 

使 用 如 图 A-7 所 示 的 B + 树 定位 一 个 键 值 ， 我 们 所 需要 做 的 是 用 所 期 望 的 值 与 存储 在 内 部 
节点 中 的 值 进行 比较 。 当 一 个 键 值 小 于 内 部 节点 中 的 键 值 时 ， 向 左 遍 历 该 树 。 相 应 地 ， 当 键 值 
大 于 或 等 于 内 部 节点 的 键 值 时 ， 就 要 向 右 遍 历 该 树 。 当 一 个 内 部 节点 已 经 达到 它 的 容量 时 ， 我 
们 需要 给 数据 库 增加 一 个 记录 ， 并 在 层次 结构 中 增加 了 额外 的 层 。 然 而 ， 删 除 记 录 不 会 引起 树 
的 立即 扁平 化 。B + 树 层 次 结构 在 一 个 名 为 数据 库 重 组 的 过 程 中 被 扁平 化 。 在 大 型 数据 库 中 数 
据 库 重组 可 能 非常 耗 时 ， 所 以 通常 只 在 绝对 必要 时 才 执 行 。 

最 好 的 数据 库 索引 方法 应 考虑 到 系统 运行 的 底层 存储 架构 。 特 别 是 为 了 获得 最 好 的 系统 性 
能 ， 磁 盘 读 取 必 须 保 持 最 小 (参见 第 11 章 ) 。 除 非 一 部 分 数据 文件 的 索引 缓存 在 主 存 中 ， 否 则 
记录 访问 要 求 至 少 有 两 次 读 操 作 : 一 次 读 索 引 ， 男 一 次 检索 记录 。 对 于 高 度 活跃 文件 的 B+ 树 
索引 ， 树 的 最 初 几 层 从 缓冲 存储 器 读 取 ， 而 不 是 从 磁盘 读 取 。 所 以 ， 仅 当 检索 索引 树 的 较 低 层 
和 数据 记录 本 身 时 才 会 读 磁 盘 。 


A.4 网 络 图 

根据 定义 ， 树 结构 不 包含 环 。 这 使 得 树 可 以 用 于 数据 存储 和 检索 ， 就 计算 复杂 度 而 言 ， 这 
是 一 项 简单 的 任务 。 问 题 越 复杂 所 需 的 结构 越 复 杂 。 例 如 ， 考 虑 在 A. 2 节 介 绍 的 路 径 问 题 时 ， 
我 们 需要 找到 从 芝加哥 到 纽约 的 返回 路 径 。 我 们 从 来 没有 说 过 要 找到 最 短路 径 ， 简 单 地 回溯 我 
们 的 步骤 是 最 简单 的 。 找 到 最 短路 径 或 优化 路 径 ， 需 要 一 种 不 同类 型 的 数据 结构 ， 它 是 一 种 多 
许 有 环 的 数据 结构 。 

一 个 n 又 树 通过 允许 叶子 节点 之 间 相 互 指向 ， 能 够 转换 成 更 一 般 的 网 络 图 。 但 是 现在 我 们 
不 得 不 允许 这 样 一 个 事实 ,任意 节点 都 有 可 能 指向 图 中 其 余 n -1 个 节点 。 如 果 我 们 简单 地 扩 
展 二 又 树 数据 结构 为 网 络 数 据 允 许 的 结构 ， 那 么 每 个 节点 将 需要 n -1 个 指针 。 我 们 能 够 做 得 
更 好 。 

如 果 问 题 中 的 这 个 网 络 是 静态 的 ， 也 就 是 说 ， 通 过 执行 我 们 的 算法 既 不 产生 也 不 丢失 节 
点 ， 那 么 这 个 网 络 可 以 用 邻接 矩阵 表示 。 一 个 邻接 矩阵 是 每 个 节点 具有 一 行 和 一 列 的 二 维 矩 
阵 。 考 虑 图 A-8a 所 示 的 图 。 它 有 6 个 相互 联系 的 节点 ,图 中 节点 之 间 的 连接 ( 边 ) 在 邻接 矩阵 
中 用 1 标示 ， 其 一 个 节点 的 行 和 另 一 个 节点 的 列 交叉 。 完 整 的 邻接 矩阵 如 图 A-8b 所 示 。 





a ) 一 般 的 图 b ) 图 的 邻接 矩阵 
图 A-8 


让 我 们 回 到 在 两 个 城市 之 间 找 一 条 优化 路 径 的 例子 。 我 们 将 地 图 表示 为 带 有 加 权 边 的 图 。 
边 上 的 权重 与 距离 相对 应 ,或 者 表示 从 一 个 城市 到 另 一 个 城市 的 “成 本 ” 。 替 代 邻 接 矩 阵 中 输 
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入 的 1， 这 些 旅行 成 本 被 输入 到 两 个 城市 之 间 的 存在 路 径 上 。 

也 可 以 将 连接 图 表示 为 链接 邻接 表 。 邻 接 表 结构 的 实现 通常 涉及 保存 在 线性 阵列 中 的 图 的 
节点， 它 是 指向 相 邻 节点 的 列表 。 这 种 安排 的 好 处 是 我 们 可 以 容易 地 定位 图 中 的 任何 节点 ,并 
上 且 一 个 节点 和 另 一 个 节点 之 间 的 移动 成 本 可 以 保存 在 脱离 阵列 的 列表 元 素 中 。 图 A-9 展示 了 加 
权 图 以 及 它 的 临界 列表 数据 结构 





a ) 加 权 图 b ) 图 的 邻接 表 
图 A-9 


一 般 的 图 ( 如 我 们 已 经 描述 的 这 种 图 ) ,已 经 广泛 用 于 解决 通信 路 由 问题 。 迪 杰 斯 特 拉 算 法 
(Dijkstra"s algorithm) 是 这 些 算法 中 最 重要 的 算法 之 一 ， 这 种 算法 的 思想 是 通过 包括 所 有 节点 之 间 
最 短 连接 集合 的 图 找到 最 小 成 本 路 径 。 这 个 算法 由 检查 与 图 的 开始 节点 相 邻 的 所 有 路 径 开始 。 它 
用 开始 节点 到 达 每 个 节点 的 成 本 更 新 每 个 节点 。 它 然后 检查 到 相 邻 节点 的 每 条 路 径 ， 用 到 达 那 个 
节点 的 成 本 更 新 每 个 节点 。 如 果 节 点 已 经 包含 一 个 成 本 ， 那 么 仅 当 到 那个 节点 的 旅行 成 本 小 于 已 
经 记录 在 那个 节点 中 值 时 ， 它 才 选 择 成 为 下 一 个 目标 。 在 图 A-10 中 解释 了 这 个 过 程 。 





c) 机 
图 A-10 迪 杰 斯 特 拉 算 法 








e) f) 
图 A-10 ( 续 ) 


在 图 A-10a 中 ， 到 达 所 有 节点 的 值 被 设置 为 无 穷 大 。 从 第 一 个 节点 到 其 相 邻 节点 的 路 径 开 
始 检查 ， 并 且 用 到 达 那 个 节点 的 成 本 更 新 每 个 节点 (如 图 A-10b 所 示 )。 检 查 从 更 少 成 本 的 节 
点 到 邻居 的 路 径 ， 如 果 成 本 小 于 节点 中 已 经 保存 的 值 ， 那 么 就 用 到 达 的 成 本 更 新 这 些 节点 。 这 
就 是 图 A-10c 中 左下 角 节 点 发 生 的 情况 。 重 复 这 个 过 程 直到 发 现 最 短路 径 ， 如 图 A-10f 所 示 。 

迪 杰 斯 特 拉 算 法 的 一 个 复杂 的 地 方 是 涉及 许多 数据 结构 。 不 仅 必 须 提 供 图 本 身 ， 而 且 还 必 
须 以 某 种 方式 记录 到 达 每 个 节点 的 路 径 ， 以 便 在 需要 时 可 以 检索 它们 。 作 为 一 个 练习 ， 表 示 所 
需 数据 结构 及 构造 在 这 些 数据 结构 上 运行 的 迪 杰 斯 特 拉 算 法 伪 代 码 。 


本 章 小 结 

本 附录 描述 了 一 些 重要 计算 机 系统 经 常 采 用 的 数据 结构 。 在 系统 最 低层 中 ， 堆 栈 和 队列 是 最 重要 的 ， 
因为 这 些 数 据 结构 的 简单 性 与 发 生 在 这 些 层次 上 的 操作 简单 性 相 匹配 。 在 系统 软件 层 ， 为 了 快速 地 进行 
信息 存储 和 检索 ， 编 译 器 和 数据 库 系 统 在 很 大 程度 上 依赖 于 树 结构 。 在 高 级 语言 层 有 最 复杂 的 数据 结构 。 
这 些 结构 可 能 包含 多 个 辅助 数据 结构 ， 正 如 我 们 在 网 络 图 中 所 示 ， 它 使 用 数组 和 链表 来 完全 描述 图 表 . 


进一步 阅读 

对 这 个 附录 中 讨论 的 所 有 主题 的 很 好 理解 ， 是 继续 学 习 计算 机 系统 和 程序 设计 的 基础 。 如 果 你 是 第 
一 次 看 到 附录 中 的 数据 结构 ， 那 么 我 们 强烈 地 建议 你 阅读 罗 林 斯 (1992 ) 编写 的 算法 书 。 这 本 书 有 趣 、 写 
得 好 并 且 丰 富 多 彩 。 对 于 更 深入 和 更 高 深 的 方法 感 兴趣 的 读者 ， 在 克 努 特 (1998 ) 编写 的 书 和 在 科 尔 曼 、 
雷 斯 尔 森 、 李 维 斯 特 和 施 泰 因 (2001 ) 编写 的 书 中 提供 了 最 详细 的 细节 。 由 Weiss( 1995 ) 编写 的 书 和 由 起 
罗 威 蒋 和 萨 尼 (1983 ) 编写 的 书 ， 提 供 了 紧凑 和 可 读 性 强 的 数据 结构 的 描述 ， 它 涵盖 了 本 附录 中 大 部 分 重 
要 的 主题 。 
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习题 

1. 就 下 列 数 据 结 构 中 的 每 一 个 给 出 至 少 一 个 最 适合 的 应 用 例子 : 
a) 数组 b) 队列 c) 链表 d) 堆栈 e) 树 

2. 正如 本 书 所 述 ， 在 一 个 优先 级 队列 中 ， 如 果 它 们 满足 一 定 条 件 ， 那 么 某 些 项 可 以 跳 过 队列 的 头 。 请 设 
计 出 实现 优先 级 队列 的 一 种 数据 结构 和 合适 的 算法 ， 

* 3. 假设 你 不 想 维护 像 树 一 样 的 一 组 排序 的 数据 元 素 ， 可 以 选择 一 个 链表 来 代替 ， 尽 管 它 的 效率 不 高 。 该 
表 按键 值 升序 排序 ， 因 此 ， 最 小 的 键 值 在 表 的 头 部 。 为 了 定位 一 个 数据 元 素 ， 你 线性 地 查找 这 个 表 ， 
直到 找到 一 个 键 值 大 于 要 查找 的 键 值 。 如 果 查 找 的 目的 是 要 在 表 中 插入 另 一 个 项 目 ， 那 么 你 将 如 何 获 
得 这 个 插入 位 置 呢 ? 换 句 话说 ， 请 给 出 一 个 列 出 每 个 步骤 的 伪 代 码 算法 。 通 过 改变 表 的 数据 结构 你 能 
够 使 这 个 算法 更 有 效 。 

4. 如 下 所 示 的 存储 器 图 描述 的 是 二 又 树 ， 请 画 出 这 个 二 又 树 



































6. 如 下 所 示 的 存储 器 图 描述 的 是 二 又 树 ， 叶 子 包含 键 值 H(48) 、I(49) 、J(4A) 、K(4B) 、L(4C) 、M 
(4D) 、N(4E) 和 0(4F) ， 请 画 出 这 个 二 又 树 。 

















7. 设计 一 个 最 大 节点 数 公式 ,使 这 些 节 点 能 够 放置 在 n 层 二 又 树 中 。 
8. 一 个 图 的 遍历 是 查询 (或 访问 ) 图 中 每 个 节点 的 行为 。 当 节点 以 一 定 顺序 ( 可 能 是 随机 的 ) 添 加 到 树 上 


并 以 其 他 给 定 的 顺序 检索 进行 时 ， 遍 历 是 有 用 的 。 下 图 展示 了 三 种 常用 的 遍历 ， 先 序 ( preorder) 、 中 
序 (inorder) 和 后 序 ( postorder) 。 图 a 解释 先 序 遍历 ， 图 b 解释 中 序 遍 历 ， 图 c 解释 后 序 遍 历 ， 


ABCDEFGHIJ 
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c ) 后 序 


9. 大 多 数 关 于 算法 和 数据 结构 的 书 把 遍历 算法 作为 递归 过 程 。( 递归 过 程 是 调用 自己 的 子 程序 或 函数 ,) 
而 ,计算 机 使 用 迭代 实现 递归 ! 下 面 这 个 算法 使 用 堆栈 来 执行 树 的 先 序 遍历 迭代 (参考 习题 8) 。 当 
遍历 每 个 节点 后 ， 会 打印 它 的 键 值 ， 如 上 图 所 示 。 
ALGORITHM Preorder 
TreeNode : node 
Boolean : done 
Stack: stack 
Node ¢- root 
Done 《一 FALSE 
WHILE NOT done 
WHILE node NOT NULL 
PRINT node 
PUSH node onto stack 
node ¢€- left child node pointer of node 
ENDWHILE 
IF stack is empty 
done 全 TRUE 
ELSE 
node € POP node from stack 
node € right child node pointer of node 
ENDIF 
ENDWHILE 
END Preorder 


a) 修改 这 个 算法 以 便 它 能 执行 中 序 遍历 。 
b) 修改 这 个 算法 以 便 它 能 执行 后 序 遍 历 。( 提示 : 当 你 跟随 节点 的 左 子 树 离开 一 个 节点 时 ， 在 这 个 节 
点 中 会 更 新 一 个 值 ， 表 明 这 个 节点 已 经 访问 过 了 。) 
10. 就 图 A-6 中 所 示 的 单词 查找 树 根 节点 而 言 ， 如 果 我 们 要 寻找 一 个 叫 Ethel 的 著名 数学 家 ， 那 么 会 出 现 
什么 难题 ? 我 们 怎样 才能 防止 这 个 问题 ? 
11. 使 用 迪 杰 斯 特 拉 算 法 找 一 条 从 纽约 到 芝加哥 更 短 的 路 径 ， 使 用 如 下 邻接 矩阵 中 给 出 的 里 程 数 。 值 "无 
穷 大 ”( % ) 表 示 在 两 个 给 定 的 城市 之 间 没 有 直接 的 连接 。 
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12. 建议 找 出 一 种 可 以 存储 邻接 矩阵 的 方法 ， 以 便 占 用 更 少 的 内 存 空间 。 
13. 设计 一 种 使 用 适当 数据 结构 的 算法 来 实现 迪 杰 斯 特 拉 算 法 。 
14. 要 想 创建 一 个 字 处 理 器 中 拼写 检查 器 所 使 用 的 字典 ， 使 用 本 附录 中 讨论 的 哪 种 数据 结构 最 好 ? 
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1. 在 硬件 和 软件 之 间 ， 一 个 提供 更 高 的 速度 ， 另 一 个 提供 更 高 的 灵活 性 。( 哪个 是 硬件 ， 哪 个 是 软件 ?) 硬 
件 和 软件 之 间 通 过 硬件 和 软件 等 效 原理 联系 在 一 起 。 一 种 方法 能 解决 另 一 种 方法 不 能 解决 的 问题 吗 ? 

3. 100 万 或 10 

10. 0.75pm 
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1 a》 121222; 
b) 10202， 
c) 4266， 
d) 6030。 
7. a) 11010. 11001 
b) 11000010. 00001 
c) 100101010. 110011 
d) 10000. 000111 
16. a) 原 码 : 01001101 
1 的 补 码 ( 反 码 ) : 01001101 
2 的 补 码 ( 反 码 ) : 01001101 偏 移 为 127 的 移 码 : 11001100 
b) 原 码 ; 10101010 
1 的 补 码 ( 反 码 ) : 11010101 
2 的 补 码 ( 反 码 ) : 11010110 偏 移 为 127 的 移 码 : 1010101 
28. a) 最 小 负数 : 100000( -31) ”最 大 正 数 : 011111(31) 
32. a) 10110000 
b) 00110000 
c) 10000000 
34. a) 00111010 
b) 00101010 
c) 01011110 
36. a) 111100 
38. a) 1001 
40. 104 
42. 提示 : 开始 跟踪 ， 如 下 所 示 : 
(二 进 制 ) k (二 进 制 ) 


| 

0 0000 -3 1100 

1 0001 -4 1011(1100 +1110)( 最 后 进位 加 到 补 码 加 法 的 和 上 ) 
2 0010 -5 1010(1011 +1110) 

3 0011 -6 1001(1010 +1110) 

4 0100 -7 1000(1001 +1110) 

5 0101 7 0111(1000 +1110)( 这 是 溢出 一 一 但 是 你 可 以 忽略 它 ) 
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46. | 误差 =2.4% 

57. a) 二 进 制 值 。 00000000 00000001 00100111 
b) ASCII 10110010 00111001 00110101 
c) 压缩 BCD ”00000000 00101001 01011100 


68. 误差 在 第 5 位 。 

73. a) 1101 余数 110 
b) 111 余数 1100 
c) 100111 余数 110 
d) 11001 余数 1000 

77. 码 字 : 1011001011 
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| 


yz 
0 
0 
0 
1 
0 
0 
0 
1 


Xx(y +Z) +Xyz 


oT 


-oo0oeocooe ol% 





3. F(z, y, 2) =wy(%+2) 
PF'(%, y, 2) = (2y (WF2))" =(xy) +(%+2)" =(% +y) + (v2) 
5. F(w, x, y, 2) =xz'(x'yz +x) +y(w'z+x') 
F'(w, x, y, 2) =(x2' (y+%) +y(Wwz + ))" 
= (xz (x yz +%)) (yw'z+% ))" 
=((x2)'+(xy tx)')(y + (wz+%")') 
=((x +2")+(%" +y +2) (2) (y+((w +2)(x")) 
=((x +z) +(x+y +2)(x))(y + (w+z)(x')) 


8. 无 效 。 一 种 证 明 方法 使 用 真 值 表 。 一 种 更 具 挑 战 性 的 方法 使 用 关系 恒等式 
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a XORb = ab +a2b 








15. a) x(yz +Y'z) +xy +x y+xz =x(Yz+y2) 十 Y(X 十 % ) 十 XZ 分 配 律 
=x(yz+y'z) +y(1) +xz 道 等 律 
=x(yz 二 yz) +y+Xz 同一 律 
=xz(y 十 y ) +y+xz 分 配 和 交换 律 
=X%Z2(1) +7y +%z 逆 等 律 
=xz +xz+y 同一 和 交换 律 
=xz +y 寡 等 律 
b) xyz“+(Yy+z) +X'yz =XyZ 十 (y 十 5) 十 % 7Z 双重 否定 
=Xyz 十 Y'z +X'yz 德 摩根 定律 
=W%yZ +X y+Y 2 交换 律 
=xz(Y 十 Y) 十 Y 2 分 配 律 
=xz(1) +Yy'z 逆 等 律 
三 和 十 Ya 同一 律 
Cc) z(xy' +z)(X+TY ) =z(xxy +XY Y +xz+y'z) 分 配 / 交 换 律 
=z(xy’ +xy +Xz +y'z) 备 等 律 
=Xy'z 十 %y'z + X22 十 22 分 配 / 交 换 律 
=Xy'z+X2+y'z 备 等 律 
=%y'z 十 yz 十 XZ 交换 律 
=yz(%t1) +xz 零 
= 2(1) + 零 
三 了 2 十 XZz 同一 律 
17. a) x(y+2z)(x’+2’) =x(x'y+yz +x'z+2z’) 分 配 / 交 换 律 
= XX'Y 十 XyZ 十 MX + X22 分 配 律 
=0 +xyz’ +0 +0 逆 等 律 / 零 
= yz 同一 律 
19. x(x’ +y) =xx’ +xy 分 配 律 
=0 十 XY 道 等 律 
=%y 同一 律 
22. F(x, y, 2) =%'y'z 十 % 2 十 XY +X + xyz 
25. y 区 XW | XxXy XZ yz XY +XYy+XZ+Yy'Z 
0 0 0 0 0 0 0 0 
0 0 1 0 0 0 1 1 
0 | 0 0 0 0 1 
0 | 1 0 1 0 0 1 
1 0 0 | 0 0 0 0 
1 0 | 1 0 1 | 1 
1 ] 0 0 0 0 0 0 
1 1 1 0 0 1 0 1 











对 两 个 乘积 的 和 取 反 是 (xz'y'z +x'y'z)'。 
33: 


36. 


49. 


50. 
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分 配 输入 ( 卡片 编码 ) 值 ， 确 定 每 个 读 取 器 的 精确 设计 。 一 种 编码 显示 在 下 表 中 。 





基于 这 个 编码 ， 服 务 器 机 房 的 读 卡 器 可 以 按 如 下 方式 来 实现 。 


E 
石 


其 余 的 设计 是 什么 ? 





B 
1 
0 
1 
1 
1 
0 
0 
1 


一 一 neDeeeece|lx 
| 
一 口 一 口上 口 一口 | 
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54. 
下 一 状态 
X 学 Z(Q} Ss Q 
0 0 0 0 0 
0 0 1 1 0 
0 ] 0 1 0 
0 1 1 0 | 
] 0 0 1 0 
| 0 1 0 1 
1 ] 0 0 1 
] 1 ] ] 1 





Clock 


当 1=0 到 8 时 完成 下 图 : 





“off” 线 “on” 线 
0 1,2,3,4 5,6,7,8 
] 2229 29?9 
8 路 232?3 


3A.1. a)x’z+xz’ b) xztxy+Xy'z 
3A.4. a) wz +w' yz +wyz b) wir’ +wx +w y+ tx'2 Or Wx +WX+NXY 十 区 2 


3A.6. a) xz +w'xz +w xy 
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3A.6. b) xy +wx'z’ 








3A. 8. x'yz+x yz +xy'z+xyz =xz(y +y) +xz(y +y) 
=0 才 中 区 
=z(xX' +%) 
3A.9. a) x+y'z( 不 想 包括 “无 关 条 件 ”， 因 为 它 对 我 们 没有 帮助 ) 


b) x'z’ +w'z 


第 4 章 
4. a) 有 2M x4 字 节 ， 总 字 节 等 于 2 x22 x22 =2”， 所 以 地 址 需要 23 位 。 
b) 有 2M 字 ， 等 于 2 x22 =2:' ， 所 以 地 址 需要 21 位 。 
10. a) 16(8 行 2 列 ) 
b) 2 
c) 256K =2*， 所 以 为 18 位 
d) 8 
e) 2M =22 ， 所 以 为 21 位 
f) 存储 体 0(000 ) 
g) 存储 体 6(110) 
15. a) 有 22 字 节 ， 使 用 0 ~22 -1 的 20 位 地 址 能 够 进行 全 部 寻 址 。 
b) 仅 有 2" 字 ， 每 个 地 址 要 求 使 用 0 ~2”-1 的 地 址 








26. a) Store 007 
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i 
地 址 一 00 01 10 11 
a) | 大 端 0 | 0 12 34 
b) | 4 端 | 34 | 2 00 00 








6. a) OxFEO1 =1111 1110 0000 0001, = =511, 


J24 
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b) Ox01FE =0000 0001 1111 1110, =510,, 
人 
12. a) XYxWZxVUx+ + 
2 


模式 值 
立即 0x1000 
直接 0x1400 








间接 0x1300 
索引 








27: YS 
b) 16 
Co 
d) 2* -1 
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la 
b) 20 位 地 址 ， 其 中 标志 域 11 位 、 块 域 5 位 、 偏 移 域 4 位 。 
c) 块 22( 或 块 0x16) 
4. a 2 2 三 27 
b) 16 位 地 址 ， 其 中 标志 域 11 位 、 偏 移 域 5 位 。 
c) 因为 是 相 联 高 速 缓存 ， 所 以 能 够 映射 到 任意 地 方 。 
7. 每 个 地 址 有 27 位 ， 其 中 标志 域 7 位 、 组 域 14 位 、 偏 移 域 6 位 。 


19， 程 序 地 址 空间 主 存 地 址 空间 


0 0 
1 1 
2 2 
3 3 
4 4 
5 5 
6 6 
yl 7 
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1. 1，28 或 28% (S$=1.2766; f=0.65; k=1.5) 

9. a) 选择 磁盘 升级 。 这 种 方式 每 改进 1% 将 花费 216. 20 美元 ， 而 CPU 是 268. 24 美元 。 
b) 磁盘 升级 的 改进 是 36. 99% ， 而 处 理 器 是 18. 64% 。 
c) 收 支 平衡 点 是 磁盘 升级 成 本 为 9922 美元 或 CPU 升级 成 本 为 4031 美元 。 

12. a) CPU 在 进入 中 断 服 务 程序 之 前 应 该 禁用 所 有 中 断 ， 因 此 中 断 不 应 该 先 发 生 。 
b) 这 不 是 问题 。 
c) 如 果 禁 用 中 断 ， 那 么 第 二 个 中 断 将 不 会 发 生 ， 所 以 这 不 是 问题 。 

22. 一 些 人 认为 从 一 个 特定 磁盘 中 检索 特定 数据 不 是 一 种 “随机 ”行为 。 

24. 旋转 延迟 (平均 等 待 时 间 ) = 7200r/m = 120r/s = 0.008 333s/r = 8.333ms/r, 或 者 (60 000ms/m)/ 
(7200r/m) =8. 333ms/r。 ) 平 均值 是 这 个 值 的 一 半 , 或 4. 17ms。 

28. a) 256MB( 1MB =22B) 
b) llms 
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32. 28. 93MB/ 磁 道 












0.25x 8760 = 2190 
有 效 千 瓦特 消耗 


空闲 小 时 /年 0.75x8760 = 6570 


6570x9.77=1000 
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5. 如 果 处 理 器 共享 一 组 特定 的 资源 ， 那 么 将 它们 作为 一 个 子 系统 可 能 是 合理 的 。 如 果 用 一 组 给 定 的 处 理 
器 测试 这 个 系统 ， 那 么 将 它们 作为 子 系统 分 组 是 明智 之 举 ， 因 为 如 果 它 们 崩溃 或 做 出 一 些 “ 奇 怪 ” 的 事 
情 ， 那 么 只 有 这 个 正在 运行 的 子 系统 会 受到 影响 。 如 果 你 正在 用 有 限 的 时 间或 有 限 的 资源 来 访问 一 组 
特定 的 人 ,那么 你 可 能 希望 这 些 用 户 进程 也 被 分 组 为 子 系统 。 

7. 当 代码 需要 更 紧凑 时 ,经 常 使 用 不 可 重 定 位 的 代码 。 因 此 ， 它 常用 在 有 空间 约束 的 授 入 式 系 统 (如 微 
波 炉 或 车 载 计算 机 ) 中 。 不 可 重 定位 的 代码 更 快 ， 因 此 它 用 于 对 小 的 时 延 敏感 的 系统 ， 例 如 实时 系统 。 
可 重 定位 代码 需要 硬件 支持 ， 所 以 不 可 重新 定位 的 代码 将 用 于 那些 可 能 没有 这 种 支持 的 情况 (例如 在 
任天堂 中 ) 。 

9. 动态 链接 节省 磁盘 空间 ( 为 什么 ) ， 导 致 更 少 的 系统 错误 ( 为什么) ， 并 允许 代码 共享 。 

19.， Java 首先 被 编译 成 字 节 码 ， 然 后 该 中 间 字 节 码 由 JVM 来 解释 。 

21. a) 当 计 算 结 果 ( 例 如 ， 输出、 数据 变量 的 值 ) 依 赖 于 特定 时 间 以 及 随 着 跨越 不 同 线 程 、 进 程 或 事务 的 

语句 执行 顺序 时 ， 出 现 竞争 条 件 。 假 设 我 们 用 以 下 两 个 事务 访问 一 个 初始 余额 为 500 的 账户 : 


事务 A 事务 B 

取 账 户 余额 取 账 户 余额 
余额 加 100 余额 减 100 
保存 新 余额 保存 新 余额 


新 余额 的 值 取决 于 事务 运行 的 顺序 。 新 余额 的 可 能 值 是 什么 ? 

b) 孤立 地 运行 事务 并 提供 原子 性 可 以 防止 竞争 条 件 。 在 数据 库 中 原子 事务 是 通过 加 锁 来 保证 的 。 

c) 使 用 锁 可 能 导致 死 锁 。 假 设 事 务 Tl 在 数据 项 X 上 获得 独占 锁 (这 意味 着 没有 其 他 事务 可 以 共享 
锁 ) ， 事 务 T2 获得 数据 项 Y 上 的 独占 锁 。 现 在 假设 Tl 需要 保持 数据 项 X 的 锁 ， 但 它 还 需要 数据 
项 Y， 而 T2 必须 保持 数据 项 Y 的 锁 ， 但 它 还 需要 数据 项 X。 这 样 就 出 现 了 一 个 死 锁 ， 因 为 每 个 事 
务 都 在 等 待 另 一 个 ， 并 且 不 会 释放 它 所 拥有 的 锁 。 
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1，RISC 计算 机 限制 可 以 访问 存储 器 的 指令 ， 仅 有 取 数 据 指令 (load) 和 存 数据 指令 (store) 可 以 访问 存储 
器 。 这 意味 着 所 有 其 他 指令 都 要 使 用 寄存 器 。 这 样 的 指令 需要 较 少 的 周期 并 可 加 快 代码 的 执行 速度 ， 
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LL: 


从 而 加 速 硬 件 的 性 能 。RISC 体系 结构 的 目标 是 实现 单 周 期 指令 ， 如 果 指令 必须 访问 存储 器 而 不 是 寄 
存 器 ， 那 么 这 是 不 可 能 的 。 


“精简 ”"(Reduced) 的 原意 是 提供 一 组 最 小 指令 ， 这 些 指令 可 以 执行 所 有 基本 操作 : 数据 移动 、ALU 操 


作 和 分 支 。 然 而 ， 当 今 RISC 计算 机 的 主要 目标 是 简化 指令 ， 以 便 它 们 能 够 更 快 地 执行 。 每 个 指令 只 
执行 一 个 操作 ， 每 个 指令 的 长 度 都 相同 ， 指 令 只 有 几 种 不 同 的 格式 ， 并 且 所 有 的 算术 运算 必须 在 寄存 
器 之 间 执 行 (内 存 中 的 数据 不 能 用 作 操 作 数 ) 。 


. 128 
. 在 执行 上 下 文 切换 过 程 中 ， 必 须 保存 当前 正在 执行 的 进程 的 所 有 信息 ， 包 括 寄存 器 窗口 中 的 值 。 当 


进程 恢复 时 ， 也 必须 恢复 寄存 器 窗口 中 的 值 。 这 取决 于 窗口 的 大 小 ， 这 可 能 是 一 个 非常 耗 时 的 
过 程 。 

a) SIMD: 单 指令 多 数据 。 一 种 特定 的 指令 在 多 个 数据 块 上 执行 。 例 如 ， 一 个 向 量 处 理 器 使 用 一 条 指 
令 执行 矩阵 加 法 运算 (CLi] = A[i] +B[i] )， 能 够 在 多 个 数据 块 上 执行 这 个 指令 (CL[1] = A[1] +B 
[1], C[2] =A[2] +B[2],C[3] =A[3] +B[3] 等 ), 具体 数量 取决 于 这 个 处 理 器 中 包含 有 多 少 
个 ALU。 


. 松 耦 合 和 紧 耦 合 是 描述 多 处 理 器 如 何 处 理 内 存 的 术语 。 如 果 有 一 个 较 大 的 、 集 中 的 、 共 享 的 存储 器 ， 


那么 我 们 说 这 个 系统 是 紧 耦 合 的 。 如 果 有 多 个 、 物 理 上 分 散 的 存储 器 ， 我 们 说 这 个 系统 是 松 耦 合 的 。 


- SIMD: 数据 并 行 ; MIMD: 控制 或 任务 并 行 。 为 什么 ? 
. 虽然 超标 量 处 理 器 依赖 于 硬件 (确定 相关 性 ) 和 编译 器 (生成 大 概 的 调度 ) ， 但 是 VLIW 处 理 器 完全 依 


赖 于 编译 器 ， 因 此 ，VLIW 将 复杂 性 完全 移 到 编译 器 。 


20. 两 种 体系 结构 都 有 少量 并 行 流 水 线 用 于 处 理 指令 。 然 而 ，VLIW 体系 结构 依赖 于 编译 器 的 正确 和 有 效 
的 方式 以 预先 打包 和 调度 指令 。 在 超标 量 体 系 结构 中 ， 指 令 调 度 是 由 硬件 完成 的 。 

21. 分 布 式 系统 允许 共享 和 宛 余 。 

23. 当 向 交叉 开关 ( crossbar) 互 连 网络 中 增加 处 理 器 时 ， 交 叉 开 关 的 数量 会 迅速 增长 到 不 可 管理 的 规模 。 
总 线 网 络 受到 潜在 瓶颈 和 争 用 问题 的 影响 。 

25. 用 写 直达 (write-through ) 方式， 新 值 立 刻 被 刷新 到 服务 器 。 这 使 得 服务 器 不 断 更 新 ， 但 写 人 需要 更 长 
时 间 ( 损 失 了 高 速 缓存 通常 提供 的 增 速 ) 。 用 写 回 ( write-back ) 方 式 ， 新 值 在 给 定 延 迟 后 刷新 到 服务 
器 。 这 种 方式 保持 了 增 速 ， 但 是 这 意味 着 如 果 服 务 器 在 新 数据 被 刷新 之 前 崩溃 ， 那 么 一 些 数 据 可 能 
会 丢失 。 这 是 一 个 说 明 性 能 改进 往往 是 有 代价 的 好 例子 。 

27. 是 的 ， 单 个 神经 元 接收 输入 、 处 理 并 提供 输出 。 然 后 这 个 输出 被 男 一 个 “下 线 ” 神 经 元 使 用 ， 然而， 
神经 元 本 身 是 并 行 工作 的 。 

29. 当 网 络 正在 学 习 时 ， 不 正确 输出 的 指示 用 于 调整 网 络 中 的 权重 。 这 些 调整 基于 各 种 优化 算法 。 当 加 
权 平 均 收敛 到 给 定 值 时 ， 学 习 就 完成 了 。 
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8. 


小 型 嵌入 式 系统 不 需要 执行 个 人 系统 必须 执行 的 复杂 通电 自 测 试 (POST) 序 列 。 首 先 ， 和 嵌入 式 系统 内 
存 比 较 小 ， 因 此 通电 检查 需要 较 少 的 时 间 。 其 次 ， 大 多 数 肯 人 式 系统 的 外 围 设 备 比 连 接 到 大 多 数 个 人 
计算 机 的 设备 要 更 少 也 更 简单 。 这 意味 着 需要 更 少 的 硬件 检查 和 更 少 的 驱动 程序 加 载 。 

中 断 延 迟 是 指 从 一 个 中 断 发 生 到 开始 执行 中 断 服务 例 程 (ISR ) 的 第 一 条 指令 所 经 历 的 (挂钟 的 ) 时 间 。 
为 了 执行 ISR 的 第 一 条 指令 ， 必 须 暂停 CPU 中 当前 正在 执行 的 线程 : 发 生 上 下 文 切换 。 因 此 ， 中 断 延 
迟 必须 大 于 上 下 文 切换 时 间 。 
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上 


3， 


系统 C 的 加 权 平 均 执 行 时 间 是 2170/5 =434。 因 此 ， 我 们 有 (563. 5/434 = 1. 298 387 - 1) x 100 =30% 
系统 A 的 性 能 已 经 下 降 了 (9563. 5/79 -1) x100 =641.49% 。 

系统 A: 算术 平均 值 =400; 几何 平均 值 =1，0.7712 和 1. 1364 

系统 B: 算术 平均 值 =525; 几何 平均 值 =1. 1396，1 和 1. 3663 
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系统 C: 算术 平均 值 =405; 几何 平均 值 =0.7946, 0.6330 和 1 

7. 这 是 不 完整 信息 的 廖 论 。 为 什么 ? 

9. 这 样 做 没有 价值 。 每 个 版 本 由 不 同 的 程序 集 组 成 ， 因 此 无 法 对 结果 进行 比较 。 

11. 首先 ， 这 是 一 个 不 确定 的 问题 。 建 议 调查 TPC-C 基准 是 否 可 用 于 该 系统 。 无 论 TPC-C 的 数字 是 否 可 
用 ， 都 应 该 理解 阿 姆 达 尔 定律 (Amdahl’s Law) 的 含义 ， 以 及 为 什么 一 个 快速 CPU 未 必 能 确定 整个 系 
统 是 否 能 够 处 理 你 的 工作 负载 。 

24. a) 5. 8 时 钟 / 指 令 ( 确 信 可 以 展示 你 的 工作 以 获得 这 个 答案 。) 
b) 5. 8MHz( 为 什么 ?) 
c) 13. 25 
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5. TCP 段 的 有 效 载荷 (数据 ) 应 尽 可 能 大 ， 以 便 发 送 段 所 需 的 网 络 开销 最 小 。 如 果 有 效 载荷 仅仅 包含 1 或 
2 字 节 ， 则 网 络 开销 将 比 传输 的 数据 大 至 少 一 个 数量 级 。 
9. a) B 类 
b) C 类 
c) A 类 
11. a) 我 们 假设 在 TCP 或 全 报头 中 没有 设置 任何 选项 ， 并 且 忽 略 任何 会 话 。 在 TCP 报头 中 有 20 字 节 并 
且 在 他 报头 中 有 20 字 节 。 对 于 一 个 1024 字 节 的 文件 ， 使 用 128 字 节 的 有 效 载荷 ， 将 不 得 不 发 送 
8 个 有 效 载 荷 。 因 此 ， 就 有 8 个 TCP 报头 和 也 报头 。 每 个 传输 单元 有 40 字 节 的 开销 ， 因 此 有 8 x 
40 字 节 的 开销 加 到 1024 字 节 的 有 效 载荷 中 ， 总 的 传输 量 是 1344 字 节 。 开 销 的 百分比 是 320 + 
1344 x100% =23. 8% 。 
b) 最 小 的 IPv6 报头 长 度 是 40 字 节 ， 加 上 TCP 报头 中 的 20 字 节 ， 每 次 传输 包含 60 字 节 的 开销 ， 发 
送 8 个 有 效 载荷 就 是 480 字 节 。 开 销 百分比 是 : 480 + 1504 x100% 或 者 31. 9% 。 
13. a) 字 节 为 1500 ~ 1599 
b) 字 节 1799 
19. a) 信 噪 比 (dB) = 10logio (2898dB/40dB) = 18. 6dB 
b) 0. 32dB = 10log10( 信号 dB/35dB) 一 信号 dB =37. 68dB 
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5. 主机 适配器 总 是 具有 最 高 的 设备 编号 ， 以 便 在 总 线 上 总 能 赢得 仲裁 。 被 称 为 “Fast and wide" 的 SCSI-3 
接口 可 以 支持 多 达 32 个 设备 ; 因此 ， 主 机 适配器 的 设备 号 总 是 31。 

附录 A 

3. 一 种 更 有 效 的 链表 实现 方法 是 在 表 的 每 个 节点 上 放置 3 个 指针 。 人 额外 的 指针 指向 什么 ? 
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本 概念 、 协 议和 关键 技术 ， 为 学 生 和 专业 人 士 理解 现行 的 网 络 技术 以 及 即将 出 现 的 新 技术 葛 
定 了 良好 的 理论 基础 。 无 论 站 在 什么 视角 ， 无论 是 应 用 开发 者 、 网 络 管理 员 还 是 网 络 设备 或 
协议 设计 者 ， 你 都 会 对 如 何 构建 现代 网 络 及 其 应 用 有 “全 景 式 ”的 理解 。 
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本 书 基于 宾夕法尼亚 州立 大 学 计算 机 组 成 和 体系 结构 课程 的 讲义 以 及 作者 30 多 年 的 教学 经 验 和 工业 实 
践 编 写 而 成 ， 曾 多 次 获得 美国 教材 和 学 术 著作 者 协会 颁发 的 “优秀 教材 奖 ”， 被 许多 大 学 选 为 计算 机 组 成 和 
体系 结构 课程 的 教材 或 主要 参考 书 

全 新 的 第 4 版 符合 ACM/IEEE CS2013 建 议 的 计算 机 组 成 和 体系 结构 课程 的 主题 ， 涵 盖 了 计算 机 组 成 和 
体系 结构 的 各 个 方面 ， 展 现 了 现代 数字 计算 机 的 内 部 工作 原理 ， 所 引用 的 实例 和 实际 应 用 便于 读者 在 大 背景 
下 理解 计算 机 组 成 和 体系 结构 的 概念 。 


本 书 特点 
e 重点 研究 处 理 数字 信息 所 需要 的 各 种 组 件 的 功能 和 设计 ， 集 中 研究 硬件 和 软件 之 间 的 接口 ， 强 调 系 统 
的 结构 和 行为 。 


e@ 包含 的 信息 主要 涉及 计算 机 硬件 、 计 算 机 组 成 与 体系 结构 以 及 它们 与 软件 性 能 的 关系 。 

® 提供 了 许多 现实 世界 的 例子 ， 以 帮助 学 生理 解 基本 概念 ， 使 理论 与 实际 相 结 合 。 

e@ 书 中 包含 的 MARIE 仿 真 包 可 以 让 学 生 学 习 计算 机 组 成 和 体系 结构 的 许多 重要 概念 ， 书 中 的 内 容 符合 
ACM/IEEE CS2013 建 议 的 主题 ， 并 增加 了 一 些 有 助 于 学 习 的 主题 。 

@ 针对 计算 机 科学 专业 的 学 生 ， 改 变 传统 计算 机 组 成 与 体系 结构 课程 的 讲授 方式 ， 为 学 生 的 学 习 提供 了 
必要 的 广度 和 深度 。 
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